【同花顺彩票_同花顺平台开户_同花顺彩票平台开户】 摘要翻译、论文写作、信息检索、抄袭检测……人工智能延伸科学交流触角

  • 时间:
  • 浏览:2
  • 来源:鹤城大发棋牌账户冻结_鹤城大发棋牌游戏大厅_鹤城大发棋牌游戏中心

  近日,一款看起来挺有文化的写稿机器人上线了。它叫小柯,由中国科学报社和北京大学科研团队同去研发。

  小柯写的都在普通的稿子,全都我中文科学新闻。据介绍,运用自然语言除理技术,小柯以英文论文摘要为基础,都都后能 快速写出中文科学新闻底稿,或者 由专业人士和报社的编辑进行把关和信息完善,帮助科学家以中文方式快速获取全球高水平英文论文中的最新科研进展。

  目前小柯的作品完后 上线。人工智能的触角,也在伸向各个领域。

  小柯:4个多 尽职的摘要翻译转写者

  科技日报记者发现,7月5日,小柯机器人发出第一篇稿子,截至8月22日记者统计时,小柯机器人共发稿415篇。初期更新时间距论文发表时间间隔4个多 月左右,现在上后能 做到当天或隔天更新,每天更新几篇到二十几篇不等。所选论文来自生命科学等领域,涉及《自然》《细胞》《新英格兰医学杂志》等期刊。

  记者对照分析了小柯作品《单细胞测序揭示冠状动脉疾病保护机制》及其英文原文。新闻中,小柯先对论文主题、研究单位以及发表期刊进行简单介绍,后接英文原文摘要的翻译,大致反映原文内容;翻译时会对原文进行适当的搞笑的话多样化,同去在对专业词语的翻译上也使用了如“血管平滑肌细胞”“保护性纤维帽”等专业表述。

  不过,这全都我都在小柯的功劳,完后 稿件发出前,还大家工审校一种生活步骤。北京大学计算机科学技术研究所研究员万小军团队负责小柯的系统总体设计与联合技术攻关。 他告诉科技日报记者,目前机器翻译系统的性能很大程度上依赖于其所使用的训练数据,即平行语料。目前的平行语料多为新闻语料,或者 训练得到的机器翻译模型对于日常新闻的翻译效果较好。但学术文献(比如生物学术论文)与日常新闻在用词造句等方面都在较大差别,机器翻译系统对于学术文献翻译的效果不须理想。

  一种生活次,亲戚亲戚大家通过融合领域知识进行搞笑的话智能筛选,选者适合大众理解的搞笑的话,并基于搞笑的话多样化提升搞笑的话翻译质量。“英文学术论文摘要适合专业科研人员阅读,但摘要中的搞笑的话不须都适合写到科学新闻中面向大众传播,或者 后能 结合编辑提供的先验知识,采用计算机算法对搞笑的话进行筛选,保留适合进行大众新闻传播的搞笑的话。”万小军说。

  自然语言除理技术后能 后能 让机器人写稿

  研发小柯用了二天时间,万小军表示,和一般写稿机器人相比,4个多 好的跨语言科技新闻写稿机器人后能 进行两次重要的信息转换过程:一次是不同语言的转换,将英文文本转换为中文文本;另一次是语言风格的转换,将学术型文字表达转换为大众都都后能 接受的通俗文字表达。“这两次转换都具有较大的挑战性,目前并如此完整版除理。后续还后能 进一步积累数据,调整算法模型,都后能 取得更好的效果。”万小军说。

  接下来,团队还将继续优化小柯,让它写出的科学新闻内容更充足,表达更生动。

  当然,翻译撰写科技新闻稿件,全都我自然语言除理等人工智能技术在学术交流中所能大显身手的领域之一。

  “基本上,若果人类交流和工作过程中涉及到语言和文字的地方,自然语言除理技术都在完后 发挥作用。”万小军说,在科研论文写作过程中,上后能 借助自然语言除理技术帮助推荐参考文献,并自动生成related work等章节的文字;业界都在基于自然语言除理技术自动编撰图书的尝试。“我当时人也接触到全都很有意思也很有挑战的应用需求,但可惜的是不少需求都无法基于目前的自然语言除理技术进行实现。自然语言除理技术还后能 进一步地发展和突破,我相信在未来将有更多的用武之地。”

  中国知网常务副总经理张宏伟长期关注自然语言除理,大数据和人工智能方面的应用研究。他告诉科技日报记者,在数字出版和知识服务的全链条中,你都能看完人工智能和机器学习技术的身影。

  人工智上后能 后能 对数字出版的选题策划、协同撰稿、内容编审进行赋能。大数据标注机器人则能对海量文献信息资源进行OCR文字识别,智能版面分析,知识元抽取,自动分类,自动标引主题,自动生成摘要,自动翻译,自动标注引用和参考文献。

  亲戚亲戚大家熟悉的论文抄袭检测,同样后能 智能技术。它都在简单的搞笑的话重复检测,全都我要对文本内容(包括图片、公式、表格等)进行语义索引,“看你在思想上有如此抄袭别人”。完后 指在不同语言之间的互抄,还后能 动用“机器翻译”。张宏伟表示,初级的语义抄袭上后能 由机器揪出来,不过,完后 足够有“心机”,完整版用当时人的语言“洗”了别人的思想,对人工智能的技术要求一下就提高了许多。目前已有利用神经网络模型对文本内容构建高维度语义索引等新技术经常经常出现,不管是中文还是英文,一律映射到4个多 统一的语义空间,实现真正基于内容理解的语义级全文比对检索。

  知识库是智慧社会的基础设施

  至于在学术研究中必不可少的资料索引,看似简单,也仍然具有技术含量。

  张宏伟说,数字出版和数字图书馆的资源类型非常充足,有大量文本、图像和音视频数据,且数据是非形状化的,若想对其进行淬硬层 的挖掘利用,难度不小。

  就拿常见的信息检索来说,首先得做到结果要全,相关度要高;再进阶一步,上后能 用自然语言交互的方式检索;升级一下难度,用智能问答的方式查找信息,上后能 直接给出答案?“要让检索功能变得更贴心,计算机要‘学会’阅读资料,总结、推理或者 回答。它后能 把海量的数据资源变成当时人上后能 理解的知识库。”张宏伟说。

  淬硬层 学习等统计方式严重依赖于大样本数据,然而,现实世界中,全都实际疑问图片仅仅依靠统计方式是无法除理的,这就后能 建立专门的计算机能理解的知识库,实现真正的人工智能。但构建知识库,一种生活是一项极其艰难且耗时漫长的工作。毕竟,机器和人对知识的理解方式大相径庭。

  张宏伟说,像知网原本 的机构正在致力于淬硬层 整合全球知识信息资源,建设世界知识大数据。也在让文本文献碎片化、网络化,方式知识使用的场景,采用半自动知识抽取算法来构建面向垂直领域的知识图谱。2019年知网陆续推出了许多基于知识图谱的行业智慧应用产品,如医疗领域的临床智能诊断,法律领域的智能量刑判案等。

  “不过,亲戚亲戚大家在哪些地方地方领域完后 起步。我当时人虽然 ,还是要大量多浮躁,踏踏实实做许多基础性的工作。如此知识的支撑,就谈不上‘智慧’。” 在张宏伟看来,知识库和人工智能,一种生活全都我互相有有助于于、相互赋能的关系。构建知识库后能 人工智能,而人工智能的发展,也离不开知识库。怎么才能 会会在么在将人类的知识库转加进计算机能理解的知识库是人工智能的核心疑问图片,面临许多困难,后能 学术界和产业界同去努力。(记者 张盖伦 实习生 陆 越)