自有记录以来,巨大的数据缺口占据了人类历史的大部分。从“作为狩猎者的人类”(MantheHunter)理论开始,编年史家几乎没有为女性在人类演化中扮演的角色留下什么空间,无论是文化还是生物学意义上的演化。相反,男性的生活被用来代表全体人类的生活。而在谈及另一半人类的生活时,通常只剩沉默。
这种沉默无处不在,遍布我们的整个文化:电影、新闻、文学、科学、城市规划、经济学。我们向自己讲述的那些关于过去、现在和未来的故事,全都扭曲了,被打上了女性“缺席”的标记。这就是性别数据缺口。
性别数据缺口不仅仅关乎沉默。这些沉默、这些缺口,皆有其后果。它们每天都在影响女性的生活。这种影响可以相对较小。例如,女性在办公室里瑟瑟发抖,因为空调温度是按男性的体温标准设定;或者伸手够货架顶端十分费劲,因为货架是按男性的身高标准设计。让人恼火吗?当然了。是不是不公平?毫无疑问。
但这些事还不会危及生命。除非你出了车祸,而汽车的安全措施在设计时又恰巧没有考虑到女性的身材;或是你的心脏病未能确诊,因为症状被视为“非典型”。对这些女性来说,生活在一个以男性数据为基础的世界里,后果可能是致命的。
论及性别数据缺口,最重要的观点之一是它通常不带恶意,甚至并非有意。事实恰恰相反:性别数据缺口完全是一种存在了数千年的思考方式的产物,因此也可说源于不思考。双重的不思考:男人不言而喻,女人不被提及。因为当我们说到人类,总的来说,我们指的是男人。
这不是什么新发现。西蒙娜·德·波伏瓦在1949年写下了著名论断:“人类是男性的,男人不是从女人本身,而是从相对男人而言来界定女人,女人不被看作一个自主的存在。(……)男人是主体,是绝对,而女人是他者。”[1]要说什么是新的,那就是女性继续作为“他者”存在的环境,而这一环境即我们所处的世界越来越依赖和受制于数据。尤其是大数据。反过来,大数据又在大计算机里接受大算法的筛选,以便筛出大真理。但当你的大数据被巨大的沉默所破坏,你得到的真相就只是半真半假。而且通常对于女性来说,它们根本就不是真的。正如计算机科学家自己说的:“垃圾进,垃圾出。”
这种新环境令消除性别数据缺口的需求更加迫切。辅助医学诊断、筛选简历甚至面试潜在求职者的人工智能已经很常见。但是训练人工智能的数据集充满了数据缺口——而且由于算法通常被当作私有软件且受到保护,我们甚至不能检查这些缺口是否被考虑在内。