基于人工智能的工具,如计算机视觉和语音界面,有可能改变残障人士的生活,但事实上,这些人工智能模型通常是在从这些人那里获得很少数据的情况下建立的。微软正在与一些非营利性合作伙伴合作,以帮助使这些工具反映生活在失明和行动不便等情况下人们的需求和日常现实。
例如考虑一个计算机视觉系统,它可以识别物体,并能描述例如桌子上的东西。该算法有可能是用正常人收集的数据进行训练的,坐在轮椅上的人想要做同样的事情,可能会发现从这个较低的角度来看,系统的效果并不理想。同样,盲人也不知道如何将摄像头保持在正确的位置上足够长的时间让算法工作,所以他们必须通过试验和错误来完成。在用于训练残疾人适用系统的面孔中,相当数量的面孔都有像呼吸机、或喷气和吹气控制器、或头带遮挡部分,如果系统从来没有见过类似的东西,这些 “混杂物 ”会大大影响准确率。
所以微软今天宣布了一些由倡导组织共同主导的努力,希望对这种限制人工智能包容性的 “数据沙漠 ”有所作为。首先是与Team Gleason合作,该组织是为了提高人们对神经运动退行性疾病肌萎缩侧索硬化症(简称ALS)的认识而成立的。他们担心的是上面那个关于面部识别的问题。患有ALS的人有各种各样的症状和辅助技术,这些都会干扰那些从未见过的算法。举例来说,如果一家公司想要出货依赖人脸识别的目光追踪软件,这就成了一个问题,微软肯定也想这么做。
Project Insight是与微软联合开展的一项新工作的名称,它将收集患有ALS的志愿者用户在开展业务时的人脸图像。随着时间的推移,这些人脸数据将与微软现有的认知服务进行整合,但也会免费发布,以便其他人可以用它来改进自己的算法。他们的目标是在2021年底发布。
另一个需要改进的地方是针对视力受损或坐在轮椅上的人,需要从他们的角度来获取数据。有两种努力旨在解决这个问题。微软与伦敦城市大学合作的一个项目是 “盲人图像训练的物体识别 ”项目,该项目正在为使用智能手机摄像头识别日常物体,建立一个数据集。不过与其他数据集不同的是,这将完全来源于盲人用户。