向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
承接过往余韵 拓展崭新波段——2022年散文创作综述******
作者:王兆胜
每年的散文作品既开相同、相似的花,也有与以往不同的花蕊,带着清晨圆润的露珠,一同滚入历史的记忆。
2022年度的散文作品,既承接了过往的余韵,又拓展了崭新的波段,在深度、高度、境界上都有所提升。
以精神提振散文品质
2022年的散文作品,在胸襟气度、精神品质特别是光泽、气息上有些与以往不同。它们大气、新鲜、有力,由一己的小我进入更广阔的天地,书写人间正道与万众人心。这相比过去较长一段时间内散文追求片面的“个人化”写作,无疑是一次跨越。
韩小蕙的《我的老师们》题目普通,但她笔下的老师却出人意料,除了有她敬佩的学者、文人,还有天安门的志愿者、小区的垃圾整理员、快递小哥。季羡林宁愿打雨伞承接楼上厕所的漏水,也不去找楼上邻居,怕给邻居添麻烦;作家凌力不让人报道她,也不愿将她的小说拍成电视剧,只为了伤口的纯粹性。于是,作者以这些品德为“师”。但此文最闪亮的还是那些平凡的老师:为抗战胜利70周年阅兵盛典忙碌的志愿者的奉献精神;清洁垃圾桶的保洁员大姐,每天应对恶臭,一直站着工作,下班了还要到商场继续工作,然而她一身整洁、从不懈怠、精神饱满、心态快乐。文章充盈着正气,洋溢着朝气,饱含着感恩,有一种朝阳般的明丽壮阔,读之让人感慨不已。
李一鸣的《一个人的创业史》与梅洁的《奋斗者的精彩人生》可以对读。它们都写小人物,都写底层人的奋斗。李一鸣笔下的是一位农民,他不断打工,“创业”成为其目标,但每次都以失败告终,不过,他从不气馁,收拾好心情再来。这篇文章的深度在于,有一种创业精神在中国普通农民身上如野生植物般蓬勃生长,不可抑止。梅洁写的是一位工人,他从不包分配的中专毕业后,进企业打工,喂猪、洗红薯、做粉条的工作夜以继日。然而,他不屈从于命运,坚持读书写诗,用了23年拿到各种各样的资格证书,最后成为高级记者,并在城里安居下来,有了自己的万册图书。这是一个靠读书、写诗走出困局的故事,主人公百折不挠的精神充满感召力。
王开岭的《静止的春天》写新冠疫情下的生活。扰乱了人们的生活,但文章并不悲观绝望,而是以心灵的阳光和美好的期许对待生活。可以说,越是在困境中,生命越要坚韧充实。从容不迫、优雅开明、诗意盎然的叙事与笔调,也使此文如春花般盛开。
除此之外,郭文斌的《大年本身是余庆》、李登建的《最后的乡贤》、辛茜的《遇见黎明,万物从容》等都是此类散文。精神的光芒不仅从人的身上升起,也在时间的地平线上照耀万事万物。从中读者能够听到时代的心跳,以及带有美好感受的生命的歌吟。
穿越历史回声的现实观照
历史回忆一直是文学特别是散文的母题。2022年的散文作品在此有所开拓与创新。其主要特点在于,对于历史有了新解,特别是赋予其现代内涵,也有了某些文化意义上的思考。
穆涛的《黄帝给我们带来的》《〈尚书〉与〈诗经〉的一场风云际会》《旧文献里的种子,以及优质土壤》《季节里的中国原理》《中国历史的学名叫春秋》等散文,是一个关于历史回望与现代思考的集束。这些资料性很强、考证细密、用功甚为专精的文章是学者型作家的标志,但最有价值的还是其中的中国文化自信,以及由此延展的中国古代制度、文化资源的现代价值。如穆涛所说:“修身养性是内装修,但内装修妥帖了,还要有所为,一个身心健康的人,如果一辈子碌碌无为,应该是最大的憾事。”“一个人做好内装修,安顿妥当了自己和家人,之后去做一番治国安邦的大事业,但最高的理想状态不是傲视群雄,一览众山小,而是与天下人和谐相处,共筑大同世界。”这是现代人从历史中咀嚼出的生命智慧。
李登建的《台子的光芒》写的是清光绪十八年在山东齐东县为防御黄洪建立的一个台子。文章入口小,但有历史纵深感,对于人事物的描写精雕细琢,营造了历史性、在场感、现实性。这是人与自然、历史、现实、自我的搏斗与和解,也是对人生、人性、生命的深刻解读。文末,作者写到带着“我”去寻访台子的王大生先生,红红的眼窝里汪着泪水,长啸一声:“我的老台子,只剩下一个小小的火烧了……”台子在岁月中沉寂,其光芒暗淡到只剩下一个火烧店,这仿佛在向世人发问,也是提出了一个需要解答的文化问题。
王月鹏的《海水与火焰》《在半岛》《海里的根》《石帆》都与大海有关,是关于海与海岛生活的感悟与升华。其中,有渔民的下海捕捞史,有海的历史文化文明碎片,也有渔民的家史、村史,都反映了海洋文化文明的现代折光。作者还从海边的奇人逸事中看到了生命底色。如海边有块石头被称为山,因露出地面的部分很少,却挖不到底,于是,作者说:“这座最矮的山,与那些孤独的岛,有着相仿的境遇。”“那些被隐匿的部分,才是真正让人尊重的存在。”
历史文化散文在2022年增加了深度,也拓展了时空感,使历史与人生智慧得以凸显。这在南帆的《二十九座滕王阁》、冯秋子的《寂静之声》、彭程的《南漳的前世今生》等作品中都有表现。历史的身影虽然斑驳,但用现代的眼光依然能看到它的余晖,以及传达出来的那种难以言传的隐喻与符码。
情到深处的感动与遐思
散文是自我抒情的最好方式。只是与诗歌比,散文更真实可靠,也具有平衡感,特别是容易将内心深处的情感挖掘出来,或是让它自然而然流淌出来。2022年散文作品的抒情性令人读来别有滋味。
王尧的《书桌上的字词句》写到父母亲情,写到自己与家庭的关系,也写到自己求学、教学、写作的心境。难得的是情深似海,却用平淡的叙事表达,在淡淡的诗意中透出人生的寂寞,也包含了某些对生活的理解与智慧。读王尧的散文随笔,内心会悄然被他的文字、情绪、思想与心语打湿,并升华起有关古往今来的思绪。作者说:“现在,我在老屋的东房,面对着书桌,把抽屉里的东西装进一只包里。阳光下的灰尘柔弱地飘浮,我在恍惚中,回到青年,回到少年。父亲没有写过一本书,但我觉得这张书桌上叠满了父亲的字词句。这些字词句散落到我的稿纸上,慢慢生长发育,我写《民谣》,就是写村庄的字词句。”这样的文字像打开一把古旧的扇子,在生命的铺展中,所有情愫都像长了翅膀一样,飘然而至。
徐可的《启功夫子逸事状》《仁者启功》是专写启功先生的。文章立足于启功的学问人生、书画艺术来谈其品格境界。其间的崇尚、喜爱、相知、相与之情溢于言表。作者从清、正、秀、雅、劲、润六个方面来品味启功的书法,也是对其人品的高度概括。“读先生法书,如对清风明月,如临一泓清水,令人神清气爽,尘杂俱灭。”文章还记取了作者与启功先生的交往,“更有幸与先生相交十数年,与先生‘情逾祖孙’”。写启功的文章甚多,但像徐可这样建立在信、爱、知、明、悦的基础上,又能有所领悟和幻化的散文作品,并不多见。
张清华的《郑敏先生二三事》是写老诗人郑敏的。张清华在文章中尽管只写了与郑敏交往的几件小事,但用情专深、感觉敏锐、诗心飘扬,一下子将书写人物的人生、生命、诗歌带入了纯净境地。从郑敏赞美张清华的声韵并想教授他和声,到老年郑敏在一次聚会上反复问了十多次张清华“你叫什么名字”,再到郑敏去世后告别仪式的落寞,这几个都是耐人寻味的细节,还有结尾张清华送别郑敏的一首诗,都将作者的情怀打开,在天地间起舞,形成一种带磁性的场的魔力。
张鸿的《梦境里的父亲》起于平淡,叙述平凡,但情真意长。对于女儿来说,父亲很少褒贬她,也不像对哥哥那样抱有更多期望,这反倒有助于她成长。通过陪父亲住院看病,特别是父亲临终时流下的一滴泪,让女儿魂断梦里,有了与父亲难以分舍的细节。这种通过普通平淡的父女关系所展示的深情,很见艺术功力。
当下写人纪事的散文很多,但真正有情、有深情又能以一种艺术形式表达出来,并非易事!而2022年的散文创作在这方面有不少收获。
草木世界折射天地之道
散文写人相对容易,写好万事万物则相当困难。这是因为作家较少有耐心观察物性,也很难真正从物性角度写物,并由此生成哲学意义的天地之道。2022年散文创作在此有所推进。
彭程的《金海湖的来去》《远处的风声》《枯叶的预约卡》是写景之作。由于作者由人入物,由动变静,由外观到内视,可以心态泰然、一平如镜、细如发丝地体验物性、情境与心境。作品写道:“大自然里各个物种的存在都有自己的理由,都是生物链条中的一个不可缺失的环节。这些无人过问的果实,实际上也加入了大自然生灭成毁的无限循环,那些挂在枯枝上的,会成为漫长冬日中飞鸟的食物,那些坠落泥土中腐烂的,则会给土壤增加养料。”从“物”的角度形成哲思,会得出与人不同的看法。
杨献平的《沙漠的细水微光》对于沙漠有独特的观察理解。通过广漠细沙那神一样的存在,作者说:“人事总是在不断地消亡和新生,过去的事物,在时间之中变成了后人的某种发现,这种现象,其实充满了悖论。可世界原本就是这个样子,总是在缔造,也总是在扬弃。唯有这沙漠,它只会不断地扩大,而不会从整体上发生根本性的变化。”以沙漠之眼观人,人的不确定性及其渺小是显而易见的。
王剑冰的《盐》,虽然写的是盐的历史,但透过盐似乎有了对生活的新解。因此,他才能“站在盐井前,说是往下看,实际上满含仰望之情”,并产生这样的思考:“出卤的一刻,千万朵白浪从细长的竹筒中迸出,像一群躲藏万年的活物四下里奔突,一会儿便又变成本色的汁液。食盐晶纯,容不下杂质,它最初的浆水竟如此悲悯,含有对众生的温爱与仁慈。”这是从盐的品性来反思人性的异化问题。
杨海蒂的《烈焰之花》是写唐山花瓷的。在作家笔下,这是由纯色瓷器向花色瓷器的转变,她用灵动的文字勾勒唐山花瓷之美,其色彩、图案、线条、光泽、灵魂都让人销魂。尽管这种美可用各种形容词形容,但作者认为最好的内在表达是,“最朴素又最惊艳,达到高深莫测的艺术境界”。这可能是人工艺术所能达到的最高境界。
还有一些写物之作值得重视。这包括何向阳的《碧水丹山》、王干的《里下河食单》、刘琼的《食,性也》、朱鸿的《菜之美者》、蒋新的《琉璃醉》、辛茜的《红花绿绒蒿》、杨文丰的《胭脂梦似的荞麦花》、赵瑜的《往日叙事》、王子罕的《“状元楼”的故乡味》、叶浅韵的《赘物记》、刘学刚的《花木有灵》等。
2022年的散文作品是丰富多彩的。本文只是撷取了其中的几朵浪花,希望能通过这几朵显示其整体气度与风采,也预示着散文创作的前景与希望。(作者王兆胜系中国社会科学杂志社副总编辑)