自聊天机(jī)器人ChatGPT火爆以(yǐ)来(lái),微软公司创始人比尔·盖茨(cí)已(yǐ)多次(cì)公(gōng)开谈(tán)论人工智能(néng)话题。在(zài)最(zuì)近(jìn)的(de)一次(cì)采访中,他再(zài)次表示:“AI可能会让科(kē)技行业迎(yíng)来一次剧烈(liè)的洗牌”。
这个结论是他(tā)在当地时间2月20日接(jiē)受(shòu)《In Good Company》节目专访时提出的。
他预期,AI的发展可能会威胁(xié)到谷歌的(de)市占率(lǜ),因为微软在AI方面(miàn)的行动相当迅速(sù)。而最终科技巨头将把AI整合成用户的“全能助手(shǒu)”,包揽一切应用(yòng),与(yǔ)人(rén)们进行(xíng)沟通并提供建议(yì),可以取(qǔ)代亚(yà)马逊(xùn)、Siri或Outlook等应用。
大佬(lǎo)口(kǒu)中(zhōng)全能助(zhù)手的到来可能尚需(xū)时日,但由ControlNet引发(fā)的又一(yī)次AI绘画浪潮,让AIGC在ChatGPT的话题(tí)热点包围(wéi)中(zhōng)杀出重围。
01
ControlNet颠覆AI绘画新玩法(fǎ)
AIGC向可控靠近
以ln函数的运算法则求导,ln运算六个基本公式AI绘画(huà)为代表的AIGC上(shàng)一次爆火(huǒ)的时候,还是2022年8月,在美国科罗拉多(duō)州(zhōu)举办的新(xīn)兴(xīng)数字艺术家竞(jìng)赛中,一(yī)幅名为《太空(kōng)歌剧院》的(de)作品获(huò)奖(jiǎng)。
随后各大厂(chǎng)商(shāng)的AI绘画软(ruǎn)件(jiàn)被广大网友熟知并体验,Stable Diffusion便是其中代表(biǎo)。
用户们(men)可以在(zài)应用中输入一组关键词或者一张照片,就能获得一幅AI创作的画作。
作画(huà)的(de)关键就是所输入的文(wén)本。同一组关键(jiàn)词(cí)也可以创作出很多张风格不一样的画(huà)作,这让创作的过程(chéng)就像(xiàng)开(kāi)盲(máng)盒。
很(hěn)多用户很喜欢(huān)这种不(bù)确定(dìng)的惊喜,他(tā)们(men)会将生(shēng)成的美图(tú)当做头像(xiàng)。而(ér)另(lìng)一部分喜欢翻(fān)看(kàn)AI绘(huì)画的“翻车”作(zuò)品。在社交媒(méi)体上(shàng),许多(duō)用(yòng)户分(fēn)享AI“翻车现场”,例如(rú),一位(wèi)网(wǎng)友的小(xiǎo)狗照(zhào)片被AI画成(chéng)了“肌肉男”,还有网友的个人照(zhào)片被(bèi)AI识别成了(le)建筑。
而如今随(suí)着ControlNet的出(chū)现与加持,以往(wǎng)AI绘画的填写关键词游戏可能要被颠覆(fù)了(le)。
ControlNet是一位正(zhèng)在斯坦福(fú)读(dú)博(bó)的中国人张吕(lǚ)敏创作(zuò)的(de)一种基于控(kòng)制点的(de)图像变(biàn)形算(suàn)法,主(zhǔ)要用于(yú)数字图(tú)像(xiàng)处(chù)理、计(jì)算机(jī)视觉和计算机图形学等领域。
其SD插件一经发布,在短短(duǎn)的两天(tiān)内(nèi)便成为了AI绘(huì)画领域最新的热点。
在此之前,大家用了很多方(fāng)法想让AI生成的结果尽可能的符合要求,但(dàn)是都不尽如人意(yì),它(tā)的出(chū)现代(dài)表着AI生成开始(shǐ)进入(rù)真正的(de)可控时期。
因为ControlNet可以直接提取(qǔ)画面的构(gòu)图,人物的(de)姿势和画面的深度(dù)信息(xī)等(děng)。有了它的帮助,就不用(yòng)频繁(fán)的用(yòng)提(tí)示(shì)词来碰运气,抽盲盒式的(de)创作(zuò)了。
通俗的说ControlNet相当于(yú)给AI绘画加(jiā)了“魔法(fǎ)”,不少博主的作品已经获(huò)得了(le)大量的(de)浏览量(liàng),“viggo”就是(shì)其中之一,他用朋友(yǒu)的(de)照片直接带她(tā)们走进动漫世界。
viggo先用StableDiffusion图片转文字。
再用(yòng)Text2Prompt插(chā)件拓展找到对应的关键词;最后用ControlNet插件绑定骨(gǔ)骼(gé)开始换关键词试效果。
通过图(tú)片就(jiù)可以看(kàn)出来,效果十分惊艳。
更厉害的是(shì),除(chú)了真实的照(zhào)片,草图也可(kě)以加上“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介绍(shào)到ControlNet还能实现线稿(gǎo)转全彩图(tú)。大神张(zhāng)吕敏其本(běn)尊也亲自回应。
不(bù)得不(bù)说当下(xià)AIGC已(yǐ)经变得越来(lái)越强(qiáng)大,甚(shèn)至输出的作(zuò)品都(dōu)已(yǐ)经能以假乱真了。
02
难辨虚实(shí),AIGC技术力爆发(fā)
警惕安全问题
近日(rì),“苏州金鸡湖(hú)有游(yóu)艇(tǐng)party”的消息火遍网络,而经过警方辟谣这所谓(wèi)的“party”可能是全国第一起(qǐ)AI绘图诈(zhà)骗。
由于这个活动里面给(gěi)出的美女(nǚ)照(zhào)片都是AI制作(zuò)的真(zhēn)人照片绘(huì)图,因为太逼真,被大家当成真事传播了(le)。
不过仔(zǎi)细观察可以(yǐ)发现,活动发起(qǐ)者提供(gōng)的照片中有个很大的(de)漏洞(dòng)可(kě)以发现并非真(zhēn)人,而是AI绘(huì)图,那便是图片中女性的(de)手指部分(fēn)有的存(cún)在异常。
有行业人事表示:“现在因为手(shǒu)指部分(fēn)的绘(huì)画算法(fǎ)比(bǐ)较复杂,AI还(hái)不太会画(huà)人(rén)的手,但最新看到的图(tú)片(piàn)已经有越来越完美的AI模型出现(xiàn),以后可能就完(wán)全没有漏洞了。”
类似的(de)AI作图诈骗在国外也已(yǐ)有发生。据(jù)英(yīng)国广播公司报道,土耳(ěr)其地震(zhèn)期间,有Tiktok用户使用AI合成了儿童(tóng)受灾的假照(zhào)片发布到网络,以此(cǐ)诱骗善(shàn)良(liáng)的人(rén)打赏“捐助(zhù)”从而(ér)实(shí)施(shī)诈骗(piàn)。
目前(qián)随(suí)着(zhe)技术发展,AIGC已经(jīng)能做出真人(rén)照(zhào)片般(bān)的(de)绘图效(xiào)果,如果这(zhè)样的图片被(bèi)用来诈骗(piàn),将非常可怕。
此外AIGC还引发了很多担忧,一方面,批(pī)判者认为(wèi)AI在“学习”了大(dà)量前人的作品之(zhī)后,其创作没(méi)有任(rèn)何情(qíng)绪和(hé)灵魂,难以和人类的艺术(shù)创作相提并论。
另一方(fāng)面,AIGC背(bèi)后(hòu)的(de)版权、目前都并没有得到有效的解决(jué),还有AIGC会不会代替人(rén)类“至高无上(shàng)”的创意。
马斯克也强调,人工智(zhì)能的安(ān)全问题需要得(dé)到重视,太(tài)晚就来不及了。
03
AIGC下一站除了视频,还(hái)有远方
技术(shù)都是有两面性的,潜在(zài)的(de)危害并(bìng)不能(néng)掩(yǎn)盖其光辉的(de)贡献。现在(zài)看来(lái),人工智能技术(shù)将是第四次工业(yè)革命的核心(xīn)驱(qū)动力量(liàng),将创造新的(de)增长奇迹。
过(guò)去一年(nián),人工智能在技术(shù)和商业层面都(dōu)有了巨大进展,AI绘(huì)画就是人(rén)工智能(néng)技术发生方(fāng)向性改(gǎi)变的一个代表。其下一(yī)站或(huò)许就是(shì)视(shì)频。
此前,Meta和谷歌(gē)先后发(fā)布了几条引爆科技圈的短视频。这些视(shì)频引(yǐn)发关注并(bìng)非(fēi)内容(róng)做(zuò)得(dé)多优秀,反而都非常简单,比(bǐ)如一匹正(zhèng)在(zài)喝水的马,一只画画的玩具熊,或者一段骑摩托车的(de)第一视(shì)角录像,随(suí)便一个有手机(jī)的人(rén)都可以随手录下一段。
但这些短视频的创(chuàng)作方式(shì)非常简单(dān),创作者仅仅需要向AI输(shū)入一段(duàn)话(huà),甚至只是说一下要求(qiú),AI就可以根据需要(yào)生成一段视频。
谷歌发布的两个AI生成(chéng)视频分别来自于Imagen Video和Phenaki,前(qián)者主要突出的是高清,与Meta的Make-A-Video没有太多的差别。
在Make-A-Video公(gōng)布了AI生成的视频后(hòu),AI圈(quān)就已经玩了一(yī)波梗,一(yī)个能(néng)够做出更高清视频的AI还不足以在短时间内戳中(zhōng)兴奋点。
Phenaki更加令人震(zhèn)惊的地(dì)方在于,它可以制作出(chū)超过2分钟的连贯(guàn)的(de)也(yě)有确切内容(róng)的视(shì)频,这(zhè)才是真正让人们感(gǎn)到(dào)惊喜的地方。因为无(wú)论(lùn)AI生成的视频多么(me)高清(qīng),也只能(néng)是为内容生产者(zhě)提供(gōng)一个(gè)灵感,一个(gè)素材,一个过场动(dòng)画(huà)。
不过能够制(zhì)作(zuò)出有具体剧情内(nèi)容的视频就意味(wèi)着(zhe),一些视频创作由AI代替人工完成(chéng)已经初步有了可能(néng)。
当下AI的发展速度已经超过大部分人的想象。内容产业的(de)本质是供给创造(zào)需求,AIGC作为(wèi)全新的内容生产方式,可以为(wèi)内容(róng)产业(yè)带来更新的内容风格(gé)、更快的生产速度,更低的生产(chǎn)成本,这无疑会驱动(dòng)内(nèi)容产业(yè)的大(dà)爆发。
除了AI绘图(tú)、视频,AIGC技术还(hái)能应(yīng)用(yòng)于音乐、代(dài)码、机器人动作等多种内容形式的生成。不(bù)难发(fā)现该项技术不仅在(zài)游(yóu)戏等行(xíng)业(yè)能得到(dào)有效应用,对于(yú)下一代互(hù)联网各种元素的构建亦有关键意义。
从(cóng)商业(yè)化的角度来(lái)看(kàn),文化娱(yú)乐、教(jiào)育(yù)、传媒等诸多领域(yù),本身就(jiù)对基(jī)于(yú)AI的可(kě)视化内容有强(qiáng)烈需求(qiú)。
因(yīn)此(cǐ),AI绘画及视频(pín)或(huò)不(bù)是结果,而只是AI进(jìn)程中的(de)一块重要拼图,有(yǒu)望在技(jì)术更新的加持下实现更大的(de)应用价值。
AI从理解(jiě)内容,走向了可以生(shēng)成内容,甚至(zhì)能够创造出独立价(jià)值(zhí)和独立视角(jiǎo)的内(nèi)容。AIGC的再(zài)次(cì)出(chū)圈,更(gèng)代表(biǎo)着(zhe)未来的先(xiān)进生产力即将到来(lái)。
04
紧抓大模型与算力,牢固AIGC底座
从技(jì)术的发(fā)展也(yě)可(kě)以看(kàn)出(chū),在语言大模型、图像大模型之(zhī)后,多模态大(dà)模型已经(jīng)成(chéng)为(wèi)了新(xīn)的(de)趋势。
大(dà)模型被誉为当前(qián)人(rén)工智能发展的(de)智能底座,是(shì)全球竞争最激(jī)烈的研究方向之(zhī)一(yī),包括谷歌(gē)、亚马逊、百度、阿里(lǐ)、腾讯(xùn)等众(zhòng)多头部企(qǐ)业都在竞(jìng)相发力。
不过训练大模型(xíng)的确价格不菲,以国(guó)盛证(zhèng)券发布的《ChatGPT需(xū)要多少(shǎo)算力》报告估算(suàn),GPT-3训练一次(cì)的成本约为(wèi)140万美(měi)元。而对于一些更大(dà)的LLM(大型(xíng)语言模型(xíng)),训练成本则介于200万(wàn)美元至1200万美元高价之间。
以ChatGPT在2023年1月的独立访客平均数1300万计(jì)算,其对应芯(xīn)片需(xū)求(qiú)为3万多(duō)片英伟达A100 GPU,初始(shǐ)投(tóu)入成本约为8亿美元(yuán),每日(rì)仅电费就(jiù)在(zài)5万美(měi)元(yuán)左右。
ln函数的运算法则求导,ln运算六个基本公式data-ratio="0.4255555555555556" data-type="jpeg" data-w="900">
此外不论(lùn)是ChatGPT还是AIGC,都(dōu)离不开庞大(dà)算力(lì)支持。在关注各类大模型的发展同时,更应该关注(zhù)算(suàn)力(lì)网络的建设(shè)。
算力网络正驱动(dòng)AI产业发展进入(rù)史诗级加速进(jìn)程,让AIGC及通用AI这一人工智能(néng)发展的终极目标离(lí)得更近。
因(yīn)为算力(lì)可(kě)以(yǐ)对突破性技术创(chuàng)新提供大(dà)力的支(zhī)持。这(zhè)方面,多(duō)模态大模(mó)型是典型。作为面(miàn)向未来强(qiáng)人(rén)工(gōng)智能、通用人工智(zhì)能的重要技术创新,多模态(tài)大模型已(yǐ)经在人工(gōng)智能领域提出(chū)了很多(duō)年,业(yè)界也有不少技术突破,但是(shì),多模(mó)态大模型进一(yī)步往下走,算力需求呈(chéng)几(jǐ)何式上升,一(yī)般的(de)算力(lì)基础设施(shī)很快(kuài)将难以胜任。
从图(tú)像、文(wén)字、语音(yīn)单独(dú)一项的训练,到双模态、三模态的跃迁,让人工智能可以灵活应(yīng)对不同模态的转化、像人与世界交互一(yī)样(yàng)自然,这(zhè)方(fāng)面,由算力(lì)网络来驱动将有(yǒu)明显(xiǎn)优势。
此外(wài),还有很多需要爆发(fā)式(shì)增长的算力来支撑的技术创新,将在人工智能算(suàn)力网络(luò)支撑下(xià)快速推进(jìn)。
AIGC已经露(lù)出曙(shǔ)光(guāng),期待在(zài)大模型和大算力的(de)支持下AIGC能持续颠覆内容(róng)生产(chǎn)的方式(shì),将创造的(de)边际成本降(jiàng)低,让万众受益。
未经允许不得转载:橘子百科-橘子都知道 ln函数的运算法则求导,ln运算六个基本公式
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了