About: Reinforcement learning from human feedback

An Entity of Type: Thing, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

Variant of reinforcement learning

Property	Value
dbo:description	és una tècnica que entrena un \model de recompensa\ directament a partir de la retroalimentació humana. (ca) Methode des maschinellen Lernens (de) stiimulõppe versioon (et) technique pour entraîner une IA (fr) variant of reinforcement learning (en) wariant uczenia przez wzmacnianie (pl) أسلوب من أساليب تعلم الآلة (ar) 以回饋內容來訓練機器學習的技術 (zh)
dbo:thumbnail	wiki-commons:Special:FilePath/RLHF_diagram.svg?width=300
dbp:wikiPageUsesTemplate	dbt:Good_article dbt:Pg dbt:Artificial_intelligence_navbox dbt:Cite_journal dbt:Cite_web dbt:Main dbt:Reflist dbt:Short_description dbt:Machine_learning
dct:subject	dbc:2017_in_artificial_intelligence dbc:Reinforcement_learning dbc:Language_modeling
rdfs:label	Reinforcement learning from human feedback (en)
prov:wasDerivedFrom	wikipedia-en:Reinforcement_learning_from_human_feedback?oldid=1311758788&ns=0
foaf:depiction	wiki-commons:Special:FilePath/RLHF_diagram.svg
foaf:homepage	http://huggingface.co
foaf:isPrimaryTopicOf	wikipedia-en:Reinforcement_learning_from_human_feedback
is foaf:primaryTopic of	wikipedia-en:Reinforcement_learning_from_human_feedback