人工智能,如何妙笔“生”画******
核心阅读
输入一段话,“绘”出一幅画——人工智能的绘画本领,吸引众多职业画师和零基础用户尝鲜。人工智能绘画的本质是计算,接受“语言描述”指令后根据自身的理解还原出图像。未来,人工智能技术应用于艺术创作等领域,还要注意防范潜在风险,让技术进步更好地造福社会。
不用画笔、颜料,输入一段描述性文字,计算机就能自动解析,生成相应的画作。2022世界人工智能大会上,人工智能绘画的展示令观众惊叹。
一些过去专属于人类创作的领域,比如绘画、书法、写作、作曲,如今人工智能也已开始涉足。人工智能是如何绘画的?当前沿技术与艺术相遇,将碰撞出怎样的火花?在内容、版权等方面又是否存在问题?
从文本到图像,人工智能绘画本质是计算
人工智能绘画是一个从文本到图像的生成过程,输入一段话,生成一幅画,本质是计算。简要地说,计算机通过大量学习,能识别特定图片元素和文本之间的关联。同理,人工智能程序在收到“语言描述”指令后,可以根据自身的算法还原出图像。
设定计算机程序作画的想法由来已久。早在20世纪70年代,就有艺术家开发了操作机械臂的电脑程序,让机械臂按照指令在画纸上作画。近些年,人工智能技术日新月异,科研人员尝试设计自动作图的计算机程序。但过去很长一段时间,人工智能“画”出的作品普遍不够好,往往只是一些模糊的图像元素的组合,还称不上是完整的画。
今年以来,人工智能画技迅速“进化”。谈及技术突破原因,百度文心一格总架构师肖欣延认为,这是预训练大模型的兴起、大数据的训练和扩散模型的出现3方面共同作用的结果。
具体来说,预训练大模型增强了人工智能的通用性,成为人工智能技术及应用的新基座;大数据的训练中,通过在众多高性能GPU(图形处理器)算力资源中进行并行学习,计算机能够在短时间内完成大量的数据学习。近年来,几乎所有人工智能的技术发展都受益于这两方面的进展。而对人工智能绘画来说,扩散模型的出现至关重要。
扩散模型的原理是,通过人为逐步添加噪声,让图像逐渐变“模糊”,再不断学习去噪过程,如此人工智能就能从完全是噪声的图片中逐渐还原出清晰的图片,即“画”出图像。
“这一过程与人类学习相似。通常,人们学画从临摹开始,机器也是如此。它最初生成的图像可能很模糊,但计算机会不断修正,从而输出越来越清楚、层次越来越丰富的图像。”肖欣延说。
扩散模型让人工智能绘画技术实现跨越,不仅作画质量快速提升,生成时间也缩短到几秒钟。
众多用户尝鲜,大量应用加速“画技”进化
汤林杰是某互联网公司的运营人员。工作中,他需要借助一些图片来丰富文案,而网络上找到合适的配图并不容易。今年10月,了解人工智能绘画程序后,他尝试自己“画”图。现在,人工智能绘画工具已经是他工作的重要辅助。
随着算法模型对公众开放以及训练数据成本的下降,人工智能绘画门槛越来越低,一些简易化操作平台在国内外兴起。如今,不仅一些职业插画师尝试用人工智能绘画程序辅助作画、激发灵感,许多没有绘画基础的用户也开始尝鲜,并“晒”在社交平台上。
大量需求的涌现也加速了技术的更新迭代。“用人工智能绘画的人越多,算法就越能理解输入的描述文本,画作质量就越高。”肖欣延表示,当前人工智能绘画水平与今年初相比,已经有很大进步。
不过,目前的人工智能绘画技术并不完美。首先,可控性仍然不高,即计算机不能很好理解人类指令的含义,即便是输入“画两个苹果,左边红色,右边绿色”这样的简单描述,生成的图像也可能有很大偏差;其次,细节呈现能力还不够。比如,对空间、透视和光影的刻画就很不如意。不少人工智能渲染出的画作,初看上去惊艳,认真观察问题却不少。
但肖欣延认为,人工智能绘画在技法上的缺陷未来有望得到弥补。比如,基于跨模态大模型和强大的深度学习框架,百度开发的技术一定程度上已经缓解这些问题。此外,未来人工智能不仅能作画,还能根据文本描述生成视频,并直接配上解说文字,“可以把视频生成看作是维度更高的绘画,从技术层面看,这是可以实现的。”
防范潜在风险,守住法律和伦理底线
人工智能进入绘画领域,计算机会取代人类画师吗?
在肖欣延看来,好的绘画与构图、设计语言、视觉情绪息息相关,即使人人都可以用人工智能技术作画,但通常只有高水平的画师才能制作出优秀的人工智能绘画作品,“人工智能只是作画的辅助工具”。此外,虽然有的人工智能绘画语言娴熟,也包含细腻的情感,但并不意味着机器有意识、情感,它不过是学过类似的作品,又恰好呈现出来了。“优秀的艺术作品往往是人的思想的投射,目前机器并没有真正具备思考能力。”肖欣延说。
不少业内人士认为,不妨以开放的心态拥抱人工智能绘画,接受新事物。可以预想,将来绘画中一些繁琐、重复性的工作可能由计算机完成,创作者能腾出更多时间去构思想法与创意,调整构图、色彩、光影氛围等。
“人工智能可能会激发绘画创造的活力。”肖欣延表示,20世纪前后,照相技术让传统肖像画失去市场,促使一些画家向非写实方向创新。与人工智能技术融合,或许能激发画家创作出别开生面的作品。
不过,由于人工智能绘画发展刚刚起步,技术发展也引发关于版权、内容把控等问题的争议。比如,有人认为,未经授权人工智能画作模仿原画的内容、构图和风格等,侵犯了原作者的版权,有违法嫌疑。也有人认为,“机器学习”过程是一种类人化的创作行为,同样体现了创造者的思想和劳动,应当获得版权保护。此外,还有人担忧,人工智能绘画技术若被滥用,可能滋生暴力等令人不适的图像。面对新技术发展,有必要前瞻潜在的风险,只有守住法律和伦理底线,技术进步才能更好地造福社会。
不只是绘画,写作、作曲、生成短片,人工智能日益强大的深度学习能力,让它与不同艺术门类发生着奇妙的碰撞。展望未来,业界专家认为,人工智能与艺术融合,一方面会降低一些艺术门类的创造门槛,让更多人参与到当代的审美创造中来;另一方面新技术会带来新的审美风格,人们或许能从中扩展对自身和世界的认识。
记者 喻思南
诺奖问答| 2022 年诺贝尔化学奖授予点击化学和生物正交化学,有哪些信息值得关注?******
相比起今年诺贝尔生理学或医学奖、物理学奖的高冷,今年诺贝尔化学奖其实是相当接地气了。
你或身边人正在用的某些药物,很有可能就来自他们的贡献。
2022 年诺贝尔化学奖因「点击化学和生物正交化学」而共同授予美国化学家卡罗琳·贝尔托西、丹麦化学家莫滕·梅尔达、美国化学家巴里·夏普莱斯(第5位两次获得诺贝尔奖的科学家)。
一、夏普莱斯:两次获得诺贝尔化学奖
2001年,巴里·夏普莱斯因为「手性催化氧化反应[1] [2] [3]」获得诺贝尔化学奖,对药物合成(以及香料等领域)做出了巨大贡献。
今年,他第二次获奖的「点击化学」,同样与药物合成有关。
1998年,已经是手性催化领军人物的夏普莱斯,发现了传统生物药物合成的一个弊端。
过去200年,人们主要在自然界植物、动物,以及微生物中能寻找能发挥药物作用的成分,然后尽可能地人工构建相同分子,以用作药物。
虽然相关药物的工业化,让现代医学取得了巨大的成功。然而随着所需分子越来越复杂,人工构建的难度也在指数级地上升。
虽然有的化学家,的确能够在实验室构造出令人惊叹的分子,但要实现工业化几乎不可能。
有机催化是一个复杂的过程,涉及到诸多的步骤。
任何一个步骤都可能产生或多或少的副产品。在实验过程中,必须不断耗费成本去去除这些副产品。
不仅成本高,这还是一个极其费时的过程,甚至最后可能还得不到理想的产物。
为了解决这些问题,夏普莱斯凭借过人智慧,提出了「点击化学(Click chemistry)」的概念[4]。
点击化学的确定也并非一蹴而就的,经过三年的沉淀,到了2001年,获得诺奖的这一年,夏普莱斯团队才完善了「点击化学」。
点击化学又被称为“链接化学”,实质上是通过链接各种小分子,来合成复杂的大分子。
夏普莱斯之所以有这样的构想,其实也是来自大自然的启发。
大自然就像一个有着神奇能力的化学家,它通过少数的单体小构件,合成丰富多样的复杂化合物。
大自然创造分子的多样性是远远超过人类的,她总是会用一些精巧的催化剂,利用复杂的反应完成合成过程,人类的技术比起来,实在是太粗糙简单了。
大自然的一些催化过程,人类几乎是不可能完成的。
一些药物研发,到了最后却破产了,恰恰是卡在了大自然设下的巨大陷阱中。
夏普莱斯不禁在想,既然大自然创造的难度,人类无法逾越,为什么不还给大自然,我们跳过这个步骤呢?
大自然有的是不需要从头构建C-C键,以及不需要重组起始材料和中间体。
在对大型化合物做加法时,这些C-C键的构建可能十分困难。但直接用大自然现有的,找到一个办法把它们拼接起来,同样可以构建复杂的化合物。
其实这种方法,就像搭积木或搭乐高一样,先组装好固定的模块(甚至点击化学可能不需要自己组装模块,直接用大自然现成的),然后再想一个方法把模块拼接起来。
诺贝尔平台给三位化学家的配图,可谓是形象生动[5] [6]:
夏普莱斯从碳-杂原子键上获得启发,构想出了碳-杂原子键(C-X-C)为基础的合成方法。
他的最终目标,是开发一套能不断扩展的模块,这些模块具有高选择性,在小型和大型应用中都能稳定可靠地工作。
「点击化学」的工作,建立在严格的实验标准上:
反应必须是模块化,应用范围广泛
具有非常高的产量
仅生成无害的副产品
反应有很强的立体选择性
反应条件简单(理想情况下,应该对氧气和水不敏感)
原料和试剂易于获得
不使用溶剂或在良性溶剂中进行(最好是水),且容易移除
可简单分离,或者使用结晶或蒸馏等非色谱方法,且产物在生理条件下稳定
反应需高热力学驱动力(>84kJ/mol)
符合原子经济
夏尔普莱斯总结归纳了大量碳-杂原子,并在2002年的一篇论文[7]中指出,叠氮化物和炔烃之间的铜催化反应是能在水中进行的可靠反应,化学家可以利用这个反应,轻松地连接不同的分子。
他认为这个反应的潜力是巨大的,可在医药领域发挥巨大作用。
二、梅尔达尔:筛选可用药物
夏尔普莱斯的直觉是多么地敏锐,在他发表这篇论文的这一年,另外一位化学家在这方面有了关键性的发现。
他就是莫滕·梅尔达尔。
梅尔达尔在叠氮化物和炔烃反应的研究发现之前,其实与“点击化学”并没有直接的联系。他反而是一个在“传统”药物研发上,走得很深的一位科学家。
为了寻找潜在药物及相关方法,他构建了巨大的分子库,囊括了数十万种不同的化合物。
他日积月累地不断筛选,意图筛选出可用的药物。
在一次利用铜离子催化炔与酰基卤化物反应时,发生了意外,炔与酰基卤化物分子的错误端(叠氮)发生了反应,成了一个环状结构——三唑。
三唑是各类药品、染料,以及农业化学品关键成分的化学构件。过去的研发,生产三唑的过程中,总是会产生大量的副产品。而这个意外过程,在铜离子的控制下,竟然没有副产品产生。
2002年,梅尔达尔发表了相关论文。
夏尔普莱斯和梅尔达尔也正式在“点击化学”领域交汇,并促使铜催化的叠氮-炔基Husigen环加成反应(Copper-Catalyzed Azide–Alkyne Cycloaddition),成为了医药生物领域应用最为广泛的点击化学反应。
三、贝尔托齐西:把点击化学运用在人体内
不过,把点击化学进一步升华的却是美国科学家——卡罗琳·贝尔托西。
虽然诺奖三人平分,但不难发现,卡罗琳·贝尔托西排在首位,在“点击化学”构图中,她也在C位。
诺贝尔化学奖颁奖时,也提到,她把点击化学带到了一个新的维度。
她解决了一个十分关键的问题,把“点击化学”运用到人体之内,这个运用也完全超出创始人夏尔普莱斯意料之外的。
这便是所谓的生物正交反应,即活细胞化学修饰,在生物体内不干扰自身生化反应而进行的化学反应。
卡罗琳·贝尔托西打开生物正交反应这扇大门,其实最开始也和“点击化学”无关。
20世纪90年代,随着分子生物学的爆发式发展,基因和蛋白质地图的绘制正在全球范围内如火如荼地进行。
然而位于蛋白质和细胞表面,发挥着重要作用的聚糖,在当时却没有工具用来分析。
当时,卡罗琳·贝尔托西意图绘制一种能将免疫细胞吸引到淋巴结的聚糖图谱,但仅仅为了掌握多聚糖的功能就用了整整四年的时间。
后来,受到一位德国科学家的启发,她打算在聚糖上面添加可识别的化学手柄来识别它们的结构。
由于要在人体中反应且不影响人体,所以这种手柄必须对所有的东西都不敏感,不与细胞内的任何其他物质发生反应。
经过翻阅大量文献,卡罗琳·贝尔托西最终找到了最佳的化学手柄。
巧合是,这个最佳化学手柄,正是一种叠氮化物,点击化学的灵魂。通过叠氮化物把荧光物质与细胞聚糖结合起来,便可以很好地分析聚糖的结构。
虽然贝尔托西的研究成果已经是划时代的,但她依旧不满意,因为叠氮化物的反应速度很不够理想。
就在这时,她注意到了巴里·夏普莱斯和莫滕·梅尔达尔的点击化学反应。
她发现铜离子可以加快荧光物质的结合速度,但铜离子对生物体却有很大毒性,她必须想到一个没有铜离子参与,还能加快反应速度的方式。
大量翻阅文献后,贝尔托西惊讶地发现,早在1961年,就有研究发现当炔被强迫形成一个环状化学结构后,与叠氮化物便会以爆炸式地进行反应。
2004年,她正式确立无铜点击化学反应(又被称为应变促进叠氮-炔化物环加成),由此成为点击化学的重大里程碑事件。
贝尔托西不仅绘制了相应的细胞聚糖图谱,更是运用到了肿瘤领域。
在肿瘤的表面会形成聚糖,从而可以保护肿瘤不受免疫系统的伤害。贝尔托西团队利用生物正交反应,发明了一种专门针对肿瘤聚糖的药物。这种药物进入人体后,会靶向破坏肿瘤聚糖,从而激活人体免疫保护。
目前该药物正在晚期癌症病人身上进行临床试验。
不难发现,虽然「点击化学」和「生物正交化学」的翻译,看起来很晦涩难懂,但其实背后是很朴素的原理。一个是如同卡扣般的拼接,一个是可以直接在人体内的运用。
「 点击化学」和「生物正交化学」都还是一个很年轻的领域,或许对人类未来还有更加深远的影响。(宋云江)
参考
https://www.nobelprize.org/prizes/chemistry/2001/press-release/
Pfenninger, A. Asymmetric Epoxidation of Allylic Alcohols: The Sharpless Epoxidation[J]. Synthesis, 1986, 1986(02):89-116.
Rao A S . Addition Reactions with Formation of Carbon–Oxygen Bonds: (i) General Methods of Epoxidation - ScienceDirect[J]. Comprehensive Organic Synthesis, 1991, 7:357-387.
Kolb HC, Finn MG, Sharpless KB. Click Chemistry: Diverse Chemical Function from a Few Good Reactions. Angew Chem Int Ed Engl. 2001 Jun 1;40(11):2004-2021.
https://www.nobelprize.org/uploads/2022/10/popular-chemistryprize2022.pdf
https://www.nobelprize.org/uploads/2022/10/advanced-chemistryprize2022.pdf
Demko ZP, Sharpless KB. A click chemistry approach to tetrazoles by Huisgen 1,3-dipolar cycloaddition: synthesis of 5-acyltetrazoles from azides and acyl cyanides. Angew Chem Int Ed Engl. 2002 Jun 17;41(12):2113-6. PMID: 19746613.