Etiquetatge de dades
Una investigació de la revista TIME va revelar que, per construir un sistema de seguretat contra el contingut tòxic (per exemple, abús sexual, violència, racisme, sexisme, etc.), OpenAI va utilitzar treballadors kenyans subcontractats que guanyaven menys de 2 dòlars per hora per etiquetar contingut tòxic. Aquestes etiquetes es van utilitzar per entrenar un model per detectar aquest contingut en el futur. Els treballadors subcontractats van estar exposats a un contingut tan tòxic i perillós que van descriure l'experiència com a "tortura". El soci subcontractat d'OpenAI va ser Sama, una empresa de dades de formació amb seu a San Francisco, Califòrnia.
Jailbreaking
ChatGPT intenta rebutjar les sol·licituds que puguin violar la seva política de contingut. Tanmateix, alguns usuaris van aconseguir fer jailbreak a ChatGPT mitjançant diverses tècniques d'enginyeria de sol·licituds per eludir aquestes restriccions a principis de desembre de 2022 i van enganyar amb èxit ChatGPT perquè donés instruccions sobre com crear un còctel Molotov o una bomba nuclear, o perquè generés arguments a l'estil d'un neonazi. Un periodista del Toronto Star va tenir un èxit personal desigual a l'hora d'aconseguir que ChatGPT fes declaracions incendiàries poc després del llançament: ChatGPT va ser enganyat per donar suport a la invasió russa d'Ucraïna del 2022, però fins i tot quan se li va demanar que jugués amb un escenari fictici, ChatGPT es va resistir a generar arguments sobre per què el primer ministre canadenc Justin Trudeau era culpable de traïció. (wiki)
Data de publicació: 18 de febrer de 2023