2019年CCF-腾讯犀牛鸟基金项目课题介绍（一）——智慧教育&机器学习

微信邦 发表于 2019-5-30 22:39:21

CCF-腾讯犀牛鸟基金由腾讯与中国计算机学会联合发起，旨在为全球范围内最具创新力的青年学者搭建产学研合作及学术交流的平台，提供了解产业真实问题，接触业务实际需求的机会，并通过连接青年学者与企业研发团队的产学科研合作，推动双方学术影响力的提升及应用成果的落地，为科技自主研发的探索和创新储备能量。
本年度共设立9个重点技术方向，29项研究命题申报截止时间：2019年6月15日24:00我们将分四期对研究命题进行详细介绍本文将介绍智慧教育和机器学习欢迎海内外青年学者关注并申报。
一、智慧教育智慧教育是本年度唯一的开放课题，旨在促进人工智能、大数据、云计算等前沿技术与教育管理，课堂教学等教育场景的融合，推动创新教育范式的革新。
1.1 “未来+教育”智慧教育技术研究
在信息技术的推动下教育领域经历了数字化、网络化、移动化的变革，正在逐步进入智能化时代。信息技术特别是智能技术正在推动教育范式的革新。教育的组织体系、教与学的模式、服务方式、人才培养体系等方面都在发生深刻变革。本课题希望能够促进信息技术与教育技术的交叉融合，探索基于人工智能、大数据、云计算等技术的“个性化”、“多模态”、“无边界”的教育范式。
建议研究方向：1)数据驱动的教育技术与应用探索，如多维度教育数据采集与智能分析、教育大数据分析与应用、智能学习分析与评测、自适应个性化教辅、智能教学管理等；2)智慧学习环境研究与应用，如知识工程驱动的教育资源组织与优化、情境感知的泛在网络学习环境、群体智能与协同学习研究，多模态学习资源组织与推荐等。
二、机器学习机器学习研究伴随着人工智能的兴起而变得越发关键。本年度该领域依然呈现出理论型研究和应用型研究相融合的特点。随着研究领域逐渐扩大，研究者将有机会将机器学习的研究成果在包括AI医疗、机器翻译、社交广告等业务场景中予以实践。
2.1 深度学习在大规模程序分析领域的应用研究
随着软件复杂度的不断提升，大规模源代码和二进制程序的漏洞挖掘工作面临新的机遇和挑战。计算机语言和自然语言有相似之处，但又存在着独特的语法结构和分析技术。本研究项目希望把深度学习相关技术（例如自然语言处理、图嵌入等）应用于大规模程序分析工作中，其成果可能对传统的漏洞挖掘工作有较大促进。
建议研究方向：1)程序语言或机器语言的函数级别表征研究，例如用于异构二进制函数的相似性比对；2)计算机语言的自动生成技术研究，例如自动生成符合语法结构的程序代码用于编译器(解释器)模糊测试；3)基于程序语义表征的安全属性分析研究，例如API误用分析，已知/未知漏洞检索等。
2.2 机器学习在新药研发中的关键技术研究
人工智能技术已经在图像、医疗、安全等领域取得了显著成果。利用人工智能技术进行新药研发是近期制药领域的热点研究问题之一。药物研发中的蛋白质折叠、分子逆合成路线设计、分子生成等传统研究问题一直是制药领域的巨大挑战。人工智能技术中深度图网络、强化学习、生成对抗网络等方法都是解决制药领域这些热点研究问题的钥匙。而如何设计新的人工智能相关技术，来帮助降低药物研发成本与时间周期仍是一个具有挑战性的研究。

建议研究方向：1)蛋白质折叠：探索新深度图网络或深度学习算法，从基因序列来预测蛋白质分子的三维结构；2)分子逆向合成路线设计：研发新的强化学习并对目标分子进行递归式拆分，最终获得更简单、更容易合成的原料，从而完成路线的设计；3)分子生成：研究生成对抗网络或变分自编码器等技术，生成满足一定功能要求的新分子机构或一级序列。
2.3 面向低资源的小语种口语机器翻译研究
本课题主要围绕民汉翻译存在的两个核心问题进行研究。其一是小语种面临的低资源和零资源的问题。例如在有少量或完全没有平行语料的情况下，如何利用单语语料，通过半监督或完全无监督的方式进行机器翻译学习。其二是如何在低资源的语音识别状况下，降低因口语化表达导致的机器翻译错误率。例如因为表达停顿，使用语气词、口头语等导致的翻译文本分段错误或语义理解错误等。
建议研究方向：1)在有少量平行语料的情况下，如何利用单语语料，通过半监督或无监督的方式进行学习；2)利用中间语言的方式，通过多任务学习的方式进行学习； 3)利用已有高资源的双语数据，通过迁移学习的方式，学习低资源或者零资源的NMT系统；4)探索通过融合文本信息和VAD的智能断句修复技术；5)基于Transition-based RNN等深度学习算法，探索利用序列标注的方法，降低因口语话表达导致的机器翻译错误问题。
2.4 3D场景在深度学习模型中的表示学习方法研究
3D游戏中的场景，通常通过数量庞大的多边形网格进行构建。对于移动游戏而言，单一场景的多边形数一般在几十万到几百万个，单一的人物多边形数在几千到几万个。同时，多边形网格的数据表现形式又较为复杂。因此，对于在复杂3D场景中的深度神经网络应用来说，难以直接从如此庞大且复杂的数据中进行学习。本课题的主要目标是面向复杂3D场景进行表示学习的研究，以得到一个较为便利的数据表示形式，从而应用在不同方向的深度学习模型中。
建议研究方向：1)通过图形学方法对原始模型进行变换；2)构建模型对变换后的数据进行表示学习；3)在给定环境中测试表示学习的效果。
2.5 面向广告推荐场景下的DNN模型结构自动学习研究
大规模DNN模型在各种广告推荐场景中发挥着越来越重要的作用，从触发召回到排序精选，各个环节基本都被DNN模型主导。目前模型结构大都依靠人工设定，随着Auto ML技术的发展，如何自动学习、优化模型结构，加强特征交互学习，提高建模效果，降低人工调参成本，对提升广告点击率、转化率预估，建构优质广告候选触发模型等起着至关重要的作用，并对推动实际业务发展具有重要意义。
建议研究方向：1)浅层（10层以下）全链接DNN模型结构参数自动学习；2)浅层模型引入attention、CNN、RNN等网络结构，自动学习优化；3)提高模型结构自动学习的技术目标，即性能可控的条件下提升建模效果，或效果持平条件下简化结构提升性能。

页: [1]

微信邦's Archiver

2019年CCF-腾讯犀牛鸟基金项目课题介绍（一）——智慧教育&机器学习