科学家发现,普通的AI模型以方言为基础的种族主义表达了秘密形式 。主要反对非裔美国人英语(AAE)的发言人
在8月28日发表的一项新研究中 自然 ,科学家首次发现证据表明,包括OpenAI的GPT3.5和GPT-4在内的常见大语模型以及Meta的Roberta表达了隐藏的种族偏见。
复制 先前的实验 该科学家旨在检查人类中隐藏的种族偏见,通过要求他们根据他们的言语模式来判断“说话者 ” ,测试了12个AI模型。科学家根据AAE和参考文本进行了绘制 。与AAE最强烈相关的最常见的三种形容词是“无知”,“懒惰”和“愚蠢 ”—而其他描述符包括“肮脏”,“粗鲁”和“侵略性 ”。AI模型没有被告知演讲者的种族群体。
AI模型测试了GPT-3.5和GPT-4 ,甚至通过描述具有积极属性的非洲裔美国人,例如“辉煌”,当直接被问及他们对该群体的观点时 ,也掩盖了这种秘密的种族主义 。
尽管AI中有关非裔美国人在人工智能中的培训数据中出现的更明显的假设并不是种族主义,但更多的秘密种族主义在大型语言模型(LLMS)中表现出来,并实际上加剧了秘密和公开刻板印象之间的差异,但通过表面上掩盖了语言模型的种族主义模型 ,这是科学家的较深层面的层次。
研究结果还表明,在LLM中,公开种族主义和秘密种族主义之间存在基本不同 ,而缓解明显的刻板印象并不能转化为减轻秘密刻板印象。有效地,试图反对明确偏见的尝试正在掩盖仍然被烘烤的隐藏偏见 。
有关的: 32次人工智能使它在灾难性上错了
科学家在论文中说:“随着对语言模型的决定的赌注,他们的担忧也反映了甚至放大了他们经过培训的数据中编码的人类偏见 ,从而使人们对种族化,性别和其他少数少数化的社会群体的歧视永存。”
长期以来,人们担心将AI培训数据烘烤到AI培训数据中 ,尤其是因为技术被广泛使用时。先前对AI偏见的研究集中在公开的种族主义实例上。一种常见的测试方法是命名一个种族群体,在培训数据中辨别与它们有关它们的刻板印象的联系,并分析各个组上任何偏见的观点的刻板印象 。
但是科学家在论文中认为 ,社会科学家认为,当今美国有一种“新的种族主义 ”,这更微妙。现在它正在进入AI。人们可以声称不看到颜色,但仍然对种族群体抱有负面信念;他们说 ,通过秘密的种族话语和习俗,这保持了种族不平等 。
正如论文发现的那样,这些信念框架正在以偏见AAE扬声器的形式培训用于训练LLM的数据。
这种效果很大程度上是因为在诸如Chatgpt之类的人类训练的聊天机器人模型中 ,演讲者的种族不一定在讨论中揭示或提出。但是,由于训练数据中的类似功能,聊天机器人的区域或文化方言上的细微差异不会丢失 。当AI确定正在与AAE扬声器交谈时 ,它表现出了培训数据中更秘密的种族主义假设。
"As well as the representational harms, by which we mean the pernicious representation of AAE speakers, we also found evidence for substantial allocational harms. This refers to the inequitable allocation of resources to AAE speakers, and adds to known cases of language technology putting speakers of AAE at a disadvantage by performing worse on AAE, misclassifying AAE as hate speech or treating AAE as incorrect English," the scientists added.“所有语言模型都更有可能向AAE的演讲者分配低调的工作,而不是向SAE的演讲者分配,并且更有可能对AAE的犯罪发言人定罪 ,并判处AAE的发言人判处死刑。
这些发现应促使公司更加努力地减少LLM的偏见,还应促使决策者考虑在可能显示出偏见的情况下禁止LLM 。这些实例包括学术评估,招聘或法律决策 ,科学家在 陈述。AI工程师还应该更好地了解种族偏见如何在AI模型中表现出来。
本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://mzwhys.cn/zlan/202506-913.html
评论列表(4条)
我是东辰文化的签约作者“admin”!
希望本篇文章《常见的AI模型认为,关于民权运动的非洲裔美国人的种族主义刻板印象;他们“在面对面时试图将其隐藏”》能对你有所帮助!
本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览:科学家发现,普通的AI模型以方言为基础的种族主义表达了秘密形式。主要反对非裔美国人英语(AAE)的发言人在8月28日发表的一项新研究中 自然,科学家首次发现证据表明,包括O...