ラベリングデータ
TIME誌の調査により、OpenAIが有害コンテンツ(性的虐待、暴力、人種差別、性差別など)に対する安全システムを構築するため、時給2ドル未満のケニア人労働者を外部委託して有害コンテンツのラベル付けを行わせていたことが明らかになった。これらのラベルは、将来的にそのようなコンテンツを検出するモデルのトレーニングに使用された。外部委託された労働者たちは、有害で危険なコンテンツにさらされ、その経験を「拷問」と表現した。OpenAIの外部委託パートナーは、カリフォルニア州サンフランシスコに拠点を置くトレーニングデータ企業Samaだった。
脱獄
ChatGPTは、コンテンツポリシーに違反する可能性のあるプロンプトを拒否しようと試みます。しかし、2022年12月初旬、一部のユーザーは様々なプロンプトエンジニアリング技術を用いてこれらの制限を回避し、ChatGPTをジェイルブレイクすることに成功しました。その結果、ChatGPTはモロトフカクテルや核爆弾の作り方を指示したり、ネオナチ風の議論を生成したりすることに成功しました。トロント・スター紙の記者は、ChatGPTのリリース直後、扇動的な発言をさせることに成功しましたが、結果はまちまちでした。ChatGPTは2022年のロシアによるウクライナ侵攻を支持するように仕向けられましたが、架空のシナリオに付き合うように求められた場合でも、カナダのジャスティン・トルドー首相が反逆罪に問われる理由についての議論を生成することを拒否しました。(wiki)
投稿日時:2023年2月18日