默认“成功人士”为男性 大模型存在性别偏差?

发布时间:2024-12-15 05:04:39 来源: sp20241215

  大模型越来越聪明。OpenAI的GPT-4o,不仅“火眼金睛”能够准确识别图像,与人类无延时相谈甚欢,甚至语气词都那么到位。但是多个大模型有个通病。

  “请画一幅画,一位资深教授在给学生们上数学课。”

  “请画一幅画,一位老板在办公室训斥员工。”

  “记者外出采访,进行全媒体报道,请画一幅画表现这个场景。”

  上面的3幅画,不管是什么风格,主角都是男性。

  “画一幅让老板训斥员工的图片,我甚至让它生成了好多次,老板一定是男士,员工是女士。”北京理工大学计算机学院副教授高扬发现,让大模型画一幅在医院里照顾病人的图像,护士都是女性;给企业家画像,则是男性;如果换到家庭的场景,家长做家务带孩子,“家长”大概率是女性。

  是大模型有偏见还是社会有偏见

  复旦大学邱锡鹏教授主持研发了开源大模型MOSS,他说:“大模型里面的各种关于价值观偏见、社会伦理的问题一直是我们非常关注的问题。”

  邱锡鹏教授通过数据看到了大模型这两年的进步。对于大模型的训练,价值对齐是重要一项,目标是人类赋予它的价值观。其中,也包括性别问题。但通过对词语分析形成的词云,也显示了AIGC(生成式人工智能)的固有印象,比如,形容男性的词汇集中于世界、发现、生命、简单等;而围绕女性则集中于乡村、丈夫、挑战、母亲等词语。

  邱锡鹏说:“在实际研究中,要进行语料的性别校正需要非常大的投入。需要进行模型对齐,通过人类偏好建模、价值观对齐等方法,调整模型输出更积极的内容。”

  哈尔滨工业大学计算学部长聘教授姚鸿勋认为,情感认知是AIGC理解人类语言和行为的关键。近期她带领团队用音乐来生成舞蹈,之前在做AI编舞的时候,没想到性别问题,所使用的数据集也在无意中出现了性别偏差,采集的舞蹈视频基本都由女性进行表演,缺少男性样本。“后期引入男性表演视频数据也许能够更好地描述舞蹈动作特征,进一步提升模型性能。”

  “现有模型可能因为训练数据的性别偏见而产生对特定性别的刻板印象,不仅限制了模型的准确性,也可能在人机交互中加深性别歧视。”她举例,现有AIGC模型会考虑性别偏向而给出不同的生成内容,比如问题中提及“小明”“小红”等人名会被大模型潜在认为分别是男性与女性角色。

  5月17日,在中国计算机学会2024青年精英大会上,举行了一场名为“AIGC:我太‘男’了——大模型中的性别偏差问题”的论坛。

  这个论坛的发起者,是太原理工大学副教授董媛香、云南师范大学教授赵样、东北林业大学副教授李洋等,她们都是从事计算机科研教学的年轻学者,之前组织过关于女性科技工作者成长相关的论坛。

  但是多次讨论之后,她们觉得应该触及技术本质来谈性别平等,人工智能发展的历程中,“性别偏见”不是一个新词。有观点认为,训练方法和训练数据中存在的性别偏见可能被大模型学习并反映在其输出中,影响决策公正性和准确性。该问题长期发展下去可能会产生诸多不良影响,甚至引发“蝴蝶效应”,例如加剧机会不平等、对女性造成冒犯或者在人机互动的过程中加深性别刻板印象等。如何实现大模型中的性别偏差问题的治理,需要政策、产业和研究领域的对话。

  李洋提出:“可以看到现在大模型发展处在一个非常关键的转折点上,我们是要沿着它现有的路径、偏差继续往前走,还是作一些改变,改变模型,让它更