向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
揭秘:是谁在联合国气候大会上为中国谈判?******
揭秘:谁在为中国谈判?
毫无悬念,联合国气候大会又拖堂了。
计划12月13日闭幕的本届大会,这会儿仍在西班牙马德里进行中。
谁在为中国谈判?为国谈判需要什么素质?
风光背后,代表们真实的谈判生活又是如何?
亲历马德里气候大会,中新社国是直通车为你揭秘今年的中国代表团。
年轻的联合战队
据国是直通车获悉,本届气候大会中国代表团成员超60人,核心谈判代表不到30人,“80后”是“主力军”,平均年龄不到35岁。
这些谈判人员的专业覆盖广泛,包括环境科学、大气物理、国际政治等等,真正专业谈判的出身较少。
代表团成员来自五湖四海。
开小会研究案文。中新社记者 夏宾 摄
既有生态环境部、外交部、财政部、交通部、科技部等各大部委的代表;也有清华大学和国家气候战略中心等高校和研究机构的精兵强将。
用中国代表团团长、生态环境部副部长赵英民话说,“我们的谈判团队非常优秀"。
在他看来,这是一支以年轻人为主,朝气蓬勃的团队。"跟谈判对手一比,基本都差个10岁左右。但是水平一点不低,专业能力非常高,而且特别能战斗。”
谈判代表必备素质
赵英民对国是直通车表示,作为中国气候谈判代表,必须具备至少如下四种素质。
——有爱国心。为国家利益而谈判。这是核心。
——有大局观。熟悉国际政治,坚持人类命运共同体理念。
——有专业能力。多边场合形势瞬息万变,必须在第一时间作出快速反应,最大程度维护国家利益。
——有坚强的意志和健康的体魄。
据国是直通车观察,赵英民团长刚抵达马德里便投入多边谈判和双面斡旋,期间严重感冒,但日程表上满满当当的安排,一个都没有耽误。在日程的间隙,他还经常穿插着会见NGO、记者等与会人士。
赵英民和媒体交流 马扬尘摄
"作为一个谈判者,最重要的是要有坚强的意志,有抗压能力。"中国代表团副团长、外交部气候变化谈判特别代表孙劲也认为,意志力是关键。
他说,在各种情况之下,对实现目标永远要保持积极的心态,永远不能放弃你要实现的目标。
跟时间赛跑
“虽然马德里是一个美丽的城市,但是谈判代表从抵达的第一天到现在基本上都是两点一线、起早贪黑,每天进入会场最早的可能就是中国代表团,离开会场最晚的,也是中国代表团。”孙劲说。
《联合国气候变化框架公约》缔约方大会涉及近200个缔约方。多边机制的一个重要特征,就是所有缔约方达成一致。诉求的多元差异,导致谈判进程极其艰难,加时赛已经成了气候大会的家常便饭。
事实上,对于每一位谈判代表来说,大会期间的每一天都在加班,白天黑夜无缝衔接,一天恨不得掰成两天用。
“80后”代表高翔,是复旦大学博士(视频中男士)。
他今年有着双重任务,一个是作为《巴黎协定》透明度议题的联合主持人,另一个是“77国集团加中国”在周期性审评议题上的集团协调员。
今年是高翔连续第11年参加气候谈判。
“每天能睡三个小时就不错了,但是第二天还是缓不过来,因为从头到尾都在开会,没有时间让你缓过来,不敢开小差。”
高翔告诉中新社国是直通车,他早上一般有三个闹钟,6点一刻响一次,是提醒自己别睡过,6点45响一次,是提醒自己下楼吃饭,7点半响一次,是提醒自己出发去会场。
谈到深夜,代表睡在中国代表团办公室。受访者供图去年的卡托维兹气候大会,因所住的地方离会场很远,为了能够把时间用在“刀刃”上,谈判人员经常会选择直接住在会场里。
“谈判会很晚很晚,就真的睡在会场,代表团很贴心地准备了睡袋。”高翔说。
在耶鲁大学拿了环境管理硕士学位的王田(视频中女士),从2012年开始加入中国气候谈判代表团。
回忆起去年卡托维茨大会,她告诉了国是直通车一个故事:因公约秘书处希望可以经常与时任中国代表团团长、气候变化事务特别代表解振华进行交流,所以特意为他准备一间离会场特别近的房间,但解振华自己并没有住,而是把房卡留在了中国代表团办公室,谁走得晚,谁就拿房卡去住。
“解主任最让我感动的,不止是把房间留给我们,还跟我们一起坐班车去会场,这样大家就尝试了在班车上开晨会,拿着导游用的大喇叭跟大家沟通情况。”王田说,这么做,无非是为了让大家多睡会儿。
跟时间的赛跑,绝不仅于此。
每次气候大会的谈判,王田最苦恼的事情是“不敢喝水”。“因为不能上厕所,一谈谈三个小时,走也不敢走。”
吃饭这事儿,经常是个"事儿"。
王田说:“有一天早上我们9点开始开会,开到下午2点,有其他国家的谈判代表说不行了,太饿了,然后主持人给了15分钟时间去吃饭,我就赶紧去找三明治和苹果,然后回来接着谈。”
2014年利马气候大会上,跟时间的战斗则让高翔“哭着”谈判。
“开夜会到晚上,晚到什么时候呢,就是我的隐形眼镜已经干得受不了了。开始不由自主地流眼泪,轮到我发言的时候,我就闭着眼睛,边流眼泪边说。”
谈判贯穿全年
没参加气候谈判前,生态环境部气候司处长陈志华眼镜的度数才100度左右,当了12年的气候谈判老兵,度数变成了400多度。
“熬夜、看材料,用眼过度视力就变差了。”
他告诉国是直通车,气候谈判不是仅仅发生在每年两个星期时间的气候大会上,更多的工作是在大会之外,进行运筹和谋划的,而且这样的磋商极为频繁。
中国代表团例行晨会 中新社记者 夏宾 摄
基本上在2011年以后,他所在的处室每年涉及气候谈判的内容有30趟左右的出访任务,有双边的也有多边的。
“气候大会之外,不是在准备去谈判筹备出访的各种手续各种材料,就是在回来做总结和汇报。”陈志华说,经常往外跑,陪家人的时间很少。
为了去年卡托维兹气候大会能取得成果,高翔的邮箱在大会召开前的10月份发生过“刷屏”事件。
“那个时候真的不可想象,因为我们要出案文,我跟美国的主持人和秘书处要沟通,邮箱20分钟就刷新了满满一屏。”
王田说:“其实我们的谈判生活是贯彻了全年的,最后能在气候大会上达成一些成果都是在事前已经做了大量工作。”
"我以他们为骄傲!"
随着中国经济实力的提升和国际地位的增强,中国在气候谈判中的领导力和贡献亦在加大。
中国代表团发言现场 玉田 摄
“整个中国代表团在逐步成长,特别是我们现在有很多年轻人担任议题的协调员,在整个谈判进程中发挥的作用比较大,一方面是中国整个影响力提升的结果,这也跟他们自己的专业素养分不开。”
中国代表团副团长、生态环境部气候司司长李高对国是直通车表示,以中国谈判代表的年龄来说,他们的业务水平已经达到了很高的水平。
在今年气候大会,李高让谈判代表们“放手去做两件事情”:一是学习怎么发挥对谈判进程和议题设置的引导作用;另一个是在透明度问题上打一仗。
效果怎么样?
高翔透露,出于维护议题进展的平衡,为了照顾发展中国家关切的问题,如长期资金适应的问题、评审的问题,中国在大会全会上对发达国家拦住而无法推动的议题提出了抗议和反对意见,“我们在那个时候没有妥协。”
“我觉得还是取得了非常好的效果。”李高说,很多发展中国家对中国表示祝贺。"从我们的角度来讲,这个团队很好地发挥了敢于斗争的精神,而且是有理有据、以理服人。"
高翔给国是直通车展示了他获得的一个意外的表彰: 巴勒斯坦外长签发的一封感谢信。
巴勒斯坦是今年七十七国集团加中国的主席,"我作为集团在周期性审评议题上的协调员,对团结发展中国家共同战斗发挥了作用,巴勒斯坦外长签发了一个写着我名字的感谢信"。
气候大会谈判现场 段茂盛 摄
“应该说在今年的谈判当中,中国代表团团队也在会场会外都引起了各方的高度的评价。”孙劲表示,中国在展现大国地位,展现大国的积极形象,同时维护发展中国家的利益,在一些重要的场合和重要的谈判当中,敢于并且善于发挥引导和领导的作用。
在某些议程上,中国也给了一些发达国家非常好的警示。就是说,中国在维护发展中国家核心关切、核心利益问题上是坚定不移的,而且中国有决心也有能力实现自身的目标。
“我非常想对这个团队说,我以他们为骄傲!”李高说。
夏宾
中国网客户端 国家重点新闻网站,9语种权威发布 |