作为中文系学生,记得在学校时候老师叮嘱有一本书一定要读,那就是《文心雕龙》。
《文心雕龙》是由南朝刘勰所作,被鲁迅先生认为可以媲美亚里士多德的《诗学》。这部著作之所以宝贵,在于它根据中国文学的发展脉络,提出了文体、原道等一系列经典理论。甚至在近现代历史上,还让“中国没有自己文学理论”的说法不攻自破。
《文心雕龙》的成功,向我们展示了这样一种理念:只有懂中国的内容与语言,理解中国独有的创作技巧、表达意境,才能提出符合中国的理论架构。这一点或许可以从文学推而广之,在更多与内容创作相关的领域找到依据。
比如最近一段时间,AIGC异常火爆,尤其AI作画已经破圈到我身边的每个人都想试试。但在一段时间之后,我们却会发现大量海外的AI作画平台,在最终表达上似乎与中国创作者的需求有些偏差。
这种问题为什么存在?又应该如何解决?
《文心雕龙》千年之后,另一个“文心”跃然而出。百度刚刚发布了文心系列大模型的新作——文心ERNIE-ViLG2.0。
(ERNIE-ViLG2.0助力视觉内容AI大生产)
与其他AI作画大模型相比,文心ERNIE-ViLG2.0有两个显著的特点。首先在通用的理解能力和清晰度上更进一步,语义理解能力更强,生成的图像更高清;另外一点就是它能够更加准确地理解中文表达,也更懂中国文化。让我们借着这个很有意思、也很独特的AIGC差异化特质,聊聊文心ERNIE-ViLG2.0的创新之路。
AI笔触融华夏,文心依旧可雕龙。
AI作画全球繁荣,但国人更需要基于语言与文化的理解
AI作画其实并不是刚刚才兴起,但愈发出色的绘画能力,以及不断降低的门槛,让AI作画在近半年时间风靡全球,从一项“极客玩具”彻底变成了街谈巷议的大众文化潮流。
AI作画有多火?这个问题有很多答案,我们可以看到AI作画的软件、平台创业者不断增多,相关的全球投融资热度在全球科技产业放缓的局面下一枝独秀。“AI作画拿下人类大奖”“AI作画以假乱真”等消息不断破圈,主流媒体也在争相探讨AI作画会不会让人类画师感到压力。
(ERNIE-ViLG2.0在中国元素相关概念上创作的图像:仙鹤、京剧)
在这种全球普遍的繁荣景象下,我们却会注意到一重潜在的“缺失”,那就是国内外蜂拥而起的AI作画产品,背后的算法能力主要是来自基于扩散生成算法的DALL-E2和StableDiffusion等国外模型。或许有人会认为这并没有什么问题。当然,我们也非常支持和推崇科技的全球化。但就实际应用而言,国外大模型却在AI作画上有着不够理解中国语言、文化的问题。这就像一个不通中文,也不理解中国文化的外国文学评论家,恐怕也难以写出媲美《文心雕龙》的文艺理论。
(ERNIE-ViLG2.0创作的图像示例:令人震撼的科幻插图杰作,神秘宇宙星辰背景中出现一只巨大的星球,大场景,无比详细,明暗对比,32k)
具体到AI作画中,我们会看到AI作画的逻辑是根据文字描述生成画面,而画作又可能应用到各行业的场景当中。这就暴露出海外AI算法作为基础存在的问题。比如说:
1.模型不能够充分理解中文描述,导致生成画面不够精细、准确。
2.模型不能理解中国行业与应用场景的主要诉求、想法以及一般规则。这让AI作画更多停留在单纯的绘画创作阶段,难以融入中国的行业诉求与行业场景。
3.模型不能准确理解中国文化,也就难以创作出针对性的作品。比如让海外AI模型创作与中国古典意境、节气、节日相关的画作,往往会产生巨大偏差。
面对AI作画基础模型的空白,文心ERNIE-ViLG2.0成为了国内首个在这一方向取得突破的工作。更懂中国文化的AI妙笔,已然成为现实。
丹青妙笔,中国心魂:文心ERNIE-ViLG2.0的多样化创新
从技术创新的逻辑上看,ERNIE-ViLG2.0带来的差异化是多方面的。首先,秉承着百度在文心大模型当中探索的知识增强方向,ERNIE-ViLG2.0本身在AI作画的技术能力上带来了大幅的提升。目前阶段,主流AI作画大模型依旧存在一些亟待解决的问题,其中最显著的两点就是语义理解不够精细,以及图像不够清晰。这些问题的存在,依旧限制了用户对AI作画的使用上限,尤其阻碍了复杂专业场景与AI作画的结合。
为此,ERNIE-ViLG2.0采用了基于知识增强算法的混合降噪专家建模,使其成为全球首个将知识增强与AI作画相互结合的大模型。同时,ERNIE-ViLG2.0也是全球参数规模最大的AI作画大模型。
据了解,ERNIE-ViLG2.0在文本生成图像公开权威评测集MS-COCO和人工盲评上均超越了StableDiffusion、DALL-E2等模型,取得了当前该领域的世界最好效果,在语义可控性、图像清晰度等方面均展现出了显著优势。
(ERNIE-ViLG2.0创作的图像示例:凤凰周身火焰,多彩的祥云,明月,cg感)
让我们具体来看,取得优秀成绩的ERNIE-ViLG2.0是如何解决语义理解与画面精度两大通用问题的。
首先,在AI作画模型的使用中,用户会特别
转载请注明:http://www.bociwangnai.com/tzysdhg/11350.html