国际最新研究构建超万张人类图像数据库 评估人工智能视觉偏见

11

北京11月6日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇人工智能(AI)研究论文,提出并构建了一个超过1万张人类图像的数据库,旨在评估AI模型在以人为本的计算机视觉领域中的偏见。

这一“公平的以人类为中心的图像基准”(FHIBE)由索尼AI团队开发,其采用符合伦理手段获取、基于用户同意的数据集,可用于评估以人为中心的计算机视觉任务,从而识别、纠正偏见和刻板印象。

国际最新研究构建超万张人类图像数据库 评估人工智能视觉偏见

该论文介绍,计算机视觉广泛应用于自动驾驶车辆到面部识别技术等领域。许多计算机视觉使用的AI模型,其训练数据存在缺陷,可能未经同意收集,经常来自网络大规模图像抓取。人们也已发现,AI模型可能会反映出延续性别歧视、种族歧视或其他刻板印象的偏见。

在本项研究中,索尼AI团队构建了一个图像数据集,在同意机制、多样性和隐私等多方面努力采取最佳实践:FHIBE包含81个国家或地区中1981个个体的10318张图像,该数据库涵盖人口统计和生理特征的全面标注,包括年龄、代词类别、祖先血统、发色与肤色等;参与者获得关于项目和潜在风险的详细信息,帮助他们做出知情同意,过程符合全面数据保护法规。这些特征使该数据库成为评估AI偏见的可靠资源。

研究团队将FHIBE和27个现有以人类为中心的计算机视觉应用数据集进行比较,发现FHIBE数据集在多样性与AI评估的可靠同意方面标准更高,同时还有效减少了偏见,它包含的参与者自我申报标注信息超过其他数据集,还包括了相当比例通常代表性不足的人群。

论文作者总结表示,FHIBE数据集可用于评估现有的AI模型在计算机视觉任务中的表现,能揭示更多此前无法了解的偏见。他们也提醒指出,创建数据集的过程充满挑战且成本高昂,但FHIBE可能代表了迈向更可信AI的一步。(完)

习言道|高度警惕外部势力在本地区煽动“新冷战”

尼泊尔新冠病毒感染病例超过一千例

九年攻坚!看哈巴雪山隧道贯通背后的故事→

全国高职建设工程数字化计量与计价赛项在青海开赛

中国GDP千亿县达52个,昆山经济总量超8个省会

中国内地首个高速公路水下互通立交主体成形

人社部:第三届全国技能大赛新增无人机系统等赛项

大病县里能医 老乡省钱省力

海南全面推动东坡文化保护利用

日本民众举行集会反对七国集团广岛峰会

黑龙江:中西医结合治疗脊柱侧弯 助力青少年“挺直腰杆”

关税战下 中国外贸进出口表现亮眼背后的底气

特朗普将在白宫为弟弟办葬礼 约200人受邀参加

俄乌局势进展:乌外长重申乌方和谈立场 俄气称向摩尔多瓦供应的天然气遭乌截留

商务部出台24条措施支持湖北自贸试验区加快发展

文章版权声明:除非注明,否则均为携程旅行网原创文章,转载或复制请以超链接形式并注明出处。