橘子百科-橘子都知道橘子百科-橘子都知道

广西大学唐纪良主任科员,广西大学唐记良

广西大学唐纪良主任科员,广西大学唐记良 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机器(qì)人ChatGPT火爆以(yǐ)来,微软公司创始人比(bǐ)尔·盖茨已(yǐ)多次公开谈论人工智(zhì)能话题。在最近的一次采访中,他再次表示:“AI可能(néng)会让(ràng)科技(jì)行业迎来一次剧烈(liè)的洗(xǐ)牌(pái)”。

这个(gè)结论是他在当(dāng)地时间2月20日接受(shòu)《In Good Company》节目专访时提出(chū)的。

他预期,AI的发展(zhǎn)可(kě)能会威胁到(dào)谷歌(gē)的市占率,因为微软在AI方面的行动(dòng)相(xiāng)当(dāng)迅速(sù)。而(ér)最终科技巨头将(jiāng)把AI整合成用户的“全能助手”,包揽一(yī)切(qiè)应用,与人(rén)们进(jìn)行沟通(tōng)并提供建议,可以取代(dài)亚(yà)马逊、Siri或Outlook等应(yīng)用。

大佬口中全能助手的到来可能尚需(xū)时日,但由(yóu)ControlNet引(yǐn)发的又一次AI绘画浪潮,让AIGC在(zài)ChatGPT的话题热点包(bāo)围中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进(jìn)入可控期,将(jiāng)洗牌(pái)科(kē)技(jì)行业?_黑料(liào)正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可(kě)控(kòng)靠(kào)近(jìn)

以AI绘(huì)画为(wèi)代表的AIGC上(shàng)一(yī)次爆火的时候,还是2022年(nián)8月,在美国科罗(luó)拉多(duō)州(zhōu)举(jǔ)办的(de)新(xīn)兴数(shù)字艺术(shù)家(jiā)竞(jìng)赛中,一幅名为《太空(kōng)歌剧院》的作品获(huò)奖。

随后各大厂商的AI绘(huì)画(huà)软件(jiàn)被广大网(wǎng)友熟知并体验,Stable Diffusion便是其中(zhōng)代表。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或(huò)进入可控(kòng)期,将洗牌(pái)科技行(xíng)业(yè)?_黑料正(zhèng)能量广西大学唐纪良主任科员,广西大学唐记良type="jpeg" data-w="639">

用户们(men)可以在应(yīng)用中(zhōng)输入一组关(guān)键词(cí)或者一张照片,就能(néng)获得一(yī)幅AI创作的画(huà)作。

作画的(de)关键(jiàn)就是所输入的文本。同一组关键词也可以创作出很多张风格(gé)不一(yī)样的画(huà)作,这让创作的过程就(jiù)像(xiàng)开盲盒。

很多用户很喜欢这种不确(què)定的惊(jīng)喜,他们会(huì)将生成的美图当做(zuò)头像。而另一部分喜欢(huān)翻看AI绘画的“翻车”作(zuò)品(pǐn)。在社交媒体上,许多用户分享AI“翻车现(xiàn)场(chǎng)”,例如,一位网友的(de)小狗照片被(bèi)AI画成了(le)“肌肉男”,还有(yǒu)网友的个(gè)人(rén)照片被AI识别成了建(jiàn)筑(zhù)。

而如今随着ControlNet的出现(xiàn)与加(jiā)持,以往AI绘画的填写关键词游(yóu)戏可(kě)能(néng)要被(bèi)颠覆了。

ChatGPT之后(hòu)又一应(yīng)用杀(shā)疯了(le),AIGC或(huò)进(jìn)入可(kě)控(kòng)期,将洗牌科技行业(yè)?_黑料正能量

ControlNet是一位正在斯(sī)坦福(fú)读博的中国(guó)人张吕敏(mǐn)创作(zuò)的一(yī)种基于控制点(diǎn)的图像变(biàn)形算法,主要(yào)用(yòng)于数(shù)字图(tú)像处理、计算机视觉(jué)和(hé)计算(suàn)机(jī)图形学等(děng)领域。

其(qí)SD插件一(yī)经发布,在短短的两天内(nèi)便成为了(le)AI绘画领域(yù)最(zuì)新的(de)热(rè)点。

在此之前,大家用了很多(duō)方法想让AI生成的结果尽可(kě)能的符(fú)合要求,但是都不尽如人(rén)意,它的出现代表着AI生成开始(shǐ)进入真正(zhèng)的可控时期。

因为ControlNet可以直接提取画(huà)面(miàn)的(de)构图(tú),人物(wù)的姿势和画面的深度信(xìn)息等。有了它的帮助,就不用频繁的(de)用提(tí)示词来碰运气,抽盲(máng)盒式的创作了(le)。

通俗的(de)说ControlNet相当于给AI绘画加了“魔法”,不少博主的(de)作品(pǐn)已经获得了(le)大量的浏览(lǎn)量,“viggo”就是其(qí)中之一,他用朋友的照片直接带她们走进动漫世(shì)界。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或(huò)进入可控(kòng)期,将洗牌(pái)科(kē)技行业?_黑料正能量

viggo先(xiān)用(yòng)StableDiffusion图片转文字。

再用Text2Prompt插(chā)件拓展找到对应的关键(jiàn)词;最后用ControlNet插件绑定骨(gǔ)骼开始换关键词试效果。

ChatGPT之(zhī)后又(yòu)一应用杀(shā)疯(fēng)了,AIGC或进入可控期(qī),将洗(xǐ)牌科技行业?_黑料(liào)正能量

通过图(tú)片就可以看出来,效果十分(f广西大学唐纪良主任科员,广西大学唐记良ēn)惊艳。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料(liào)正能量

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入(rù)可(kě)控(kòng)期(qī),将洗牌科技行业?_黑料正能量

更厉害(hài)的是,除了(le)真实的照片,草图也可以加(jiā)上(shàng)“魔法”,知乎(hū)大牛“DevPoint”和“逗(dòu)砂”介(jiè)绍到ControlNet还能实现线稿(gǎo)转全彩(cǎi)图。大神张吕敏其本(běn)尊也亲(qīn)自回应。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进入可控(kòng)期(qī),将洗牌科技行业?_黑(hēi)料(liào)正能量

不(bù)得不说当下AIGC已经变(biàn)得越来越强大,甚至(zhì)输出(chū)的(de)作品都已(yǐ)经能以(yǐ)假乱真了(le)。

02

难辨虚实,AIGC技术力爆发

警惕安全问题

近日,“苏(sū)州(zhōu)金鸡湖有(yǒu)游艇party”的消息火遍网络,而经过(guò)警方辟谣这(zhè)所谓的(de)“party”可能是全(quán)国第一(yī)起AI绘图诈骗。

由(yóu)于(yú)这个活动里面给出的美(měi)女(nǚ)照片都是(shì)AI制作的(de)真人照片绘图,因为太逼真,被大家(jiā)当成真事传播(bō)了(le)

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或进入可控期,将洗牌科技行业?_黑料正能量

不过(guò)仔细观(guān)察(chá)可以发现(xiàn),活(huó)动(dòng)发起者(zhě)提(tí)供的(de)照片中(zhōng)有(yǒu)个很大的漏洞可以发现并非真(zhēn)人,而是(shì)AI绘图,那便是图片中女性的(de)手(shǒu)指(zhǐ)部(bù)分有的(de)存在异常。

ChatGPT之后又一(yī)应用(yòng)杀疯了(le),AIGC或进入可控期,将洗牌科技行业?_黑料正能量

有行(xíng)业人事表示:“现在因为(wèi)手(shǒu)指(zhǐ)部分的绘(huì)画算法比较复杂(zá),AI还不太会画人(rén)的手(shǒu),但最新看到的图片(piàn)已经有越来越完美的AI模型出现,以后可(kě)能就完全没(méi)有漏洞了。

类似(shì)的AI作图诈骗(piàn)在国外也已有发生。据(jù)英国(guó)广播(bō)公司(sī)报道,土(tǔ)耳其(qí)地(dì)震期间,有Tiktok用户使用AI合成了儿童受(shòu)灾的假(jiǎ)照(zhào)片发(fā)布(bù)到网络,以此诱骗善(shàn)良的人打赏“捐助”从而实施诈骗。

目(mù)前随着技术发展,AIGC已经能做出真人照片(piàn)般的(de)绘图效(xiào)果,如果(guǒ)这样(yàng)的图片被用来诈骗,将非常(cháng)可怕。

此外AIGC还引发(fā)了很多担忧,一方面,批判者认(rèn)为AI在“学习”了大量前人的作品(pǐn)之(zhī)后,其创作没有任何情(qíng)绪(xù)和灵魂,难以和人类的艺术创(chuàng)作相(xiāng)提并论。

另(lìng)一方(fāng)面(miàn),AIGC背后的版权、目前都并没有得到有效的解决,还(hái)有AIGC会不会代替(tì)人(rén)类(lèi)“至高无上”的创意。

马(mǎ)斯克也强调,人工智能的(de)安(ān)全(quán)问题需(xū)要得到重(zhòng)视(shì),太晚就来(lái)不及了。

03

AIGC下一站除了(le)视频,还有远方(fāng)

技术(shù)都(dōu)是有两面性的,潜(qián)在的危(wēi)害并不能掩盖其(qí)光辉的贡献。现在看来,人(rén)工智能技术将是第四次工业(yè)革命的核心(xīn)驱动力量(liàng),将创造新的增长奇迹。

过去一年,人工智能在技术和商(shāng)业层(céng)面都有了(le)巨大进(jìn)展,AI绘画就是人工(gōng)智能技术发生方(fāng)向(xiàng)性改变的(de)一(yī)个代表。其下一站或许就是视频。

此前,Meta和谷歌先(xiān)后(hòu)发(fā)布了(le)几条引爆科技圈(quān)的短视频。这些视频引发关注并非内(nèi)容做得(dé)多(duō)优(yōu)秀(xiù),反而(ér)都非常(cháng)简单,比如一匹正在喝(hē)水的马,一(yī)只画(huà)画(huà)的玩(wán)具熊,或者(zhě)一段骑摩托(tuō)车(chē)的第一视角录(lù)像,随便一个(gè)有手机的人都可以随(suí)手(shǒu)录下(xià)一段。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期,将洗牌科技(jì)行业?_黑料正能量

但这些短视(shì)频的创作方(fāng)式(shì)非(fēi)常简单,创作者(zhě)仅仅需要向AI输入一段话,甚至只是说一下要求,AI就可以(yǐ)根据需要生成一段视频。

谷(gǔ)歌发布的两个(gè)AI生(shēng)成视(shì)频分别(bié)来自于Imagen Video和(hé)Phenaki,前者主要突出的是(shì)高(gāo)清,与Meta的(de)Make-A-Video没有太多(duō)的差别。

在Make-A-Video公布了AI生成的(de)视(shì)频后,AI圈就(jiù)已经玩了一波(bō)梗,一个能够(gòu)做出(chū)更高清视频的AI还不足(zú)以(yǐ)在(zài)短时间内戳中(zhōng)兴奋点。

Phenaki更加令人震惊的地方在于(yú),它可以制作(zuò)出(chū)超过2分钟的连贯的也有确切内(nèi)容的(de)视(shì)频,这才是真正让人们(men)感到惊喜的地方。因为无论AI生成的视频多(duō)么高清,也(yě)只能是为内容生产者提供一个灵感,一个(gè)素材,一个过场(chǎng)动画。

不过能够制(zhì)作出有具体剧情(qíng)内容的视频就意味着,一(yī)些视(shì)频创(chuàng)作(zuò)由(yóu)AI代替人工完成(chéng)已经(jīng)初步(bù)有了(le)可能。

当下(xià)AI的发展速度已经超过(guò)大部(bù)分人的想象(xiàng)。内容产(chǎn)业的本质是供(gōng)给创(chuàng)造需求,AIGC作为全(quán)新的内容生(shēng)产方式,可(kě)以为内容产业带来(lái)更新的(de)内容风格、更(gèng)快的生(shēng)产(chǎn)速度,更低的生产成(chéng)本,这无疑会驱动内容产业的大爆发。

除了AI绘图、视频,AIGC技术还(hái)能应用于音(yīn)乐(lè)、代码、机器人动作等多种内容形(xíng)式(shì)的生成。不难发现该项技术不仅在游(yóu)戏等行业能得到有效应(yīng)用,对于下一代互联网各种(zhǒng)元素的构(gòu)建(jiàn)亦有关键意义。

从商(shāng)业化(huà)的角度来看(kàn),文化娱(yú)乐、教育、传(chuán)媒等诸多(duō)领域,本身就对基于(yú)AI的可视化内容有(yǒu)强烈需求。

因此,AI绘画及视频或不是结(jié)果(guǒ),而只是AI进程中的(de)一块重要拼图(tú),有望在(zài)技术更新(xīn)的加持下实现更(gèng)大的应用(yòng)价值。

AI从(cóng)理解内容,走向了可以(yǐ)生成内容,甚至(zhì)能够创造(zào)出独(dú)立价值和(hé)独立视角(jiǎo)的内容。AIGC的再次出圈(quān),更代表着(zhe)未来的先(xiān)进生产(chǎn)力(lì)即将(jiāng)到来。

ChatGPT之后(hòu)又一应用(yòng)杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑(hēi)料(liào)正能量

04

紧抓(zhuā)大模型(xíng)与算力(lì),牢固AIGC底座

从技(jì)术的发展也可以看出,在语言大模型(xíng)、图(tú)像大模型之后(hòu),多(duō)模态大模型已经成为了新的(de)趋势。

大模型被誉为当前人工智(zhì)能(néng)发展的智能底座,是全(quán)球(qiú)竞争最(zuì)激烈(liè)的研(yán)究方(fāng)向(xiàng)之一,包括谷歌、亚马逊、百(bǎi)度、阿里、腾讯等众多头部企业都(dōu)在竞相发(fā)力。

不过训练大模型的确(què)价格(gé)不菲,以国盛证(zhèng)券发布的《ChatGPT需(xū)要多少算力(lì)》报告估算(suàn),GPT-3训练一次的成本约为140万美元。而对于一些更(gèng)大的(de)LLM(大型(xíng)语(yǔ)言模型),训练成本则介(jiè)于200万美元至1200万(wàn)美元高价之(zhī)间。

以ChatGPT在2023年1月(yuè)的(de)独(dú)立访客平均数1300万(wàn)计(jì)算(suàn),其对应芯片(piàn)需求为(wèi)3万多片英伟达A100 GPU,初(chū)始投入(rù)成本约为8亿(yì)美元,每日(rì)仅电费就在5万(wàn)美(měi)元左(zuǒ)右。

ChatGPT之后又一应(yīng)用杀疯(fēng)了,AIGC或进入(rù)可控期,将洗牌科技行业?_黑料正(zhèng)能量

此外不论是ChatGPT还是(shì)AIGC,都离不开庞大算力(lì)支持。在关注各类大模型的(de)发展(zhǎn)同时,更应(yīng)该关注算力网(wǎng)络的(de)建设。

算力网络正驱(qū)动AI产业(yè)发展(zhǎn)进入史诗(shī)级加速(sù)进程,让AIGC及通用AI这一(yī)人工智能发展(zhǎn)的(de)终极目标离(lí)得更近。

因为(wèi)算(suàn)力(lì)可(kě)以对(duì)突破性技术创新(xīn)提供大力的(de)支持。这方面,多模(mó)态(tài)大模型是(shì)典(diǎn)型。作为面向未(wèi)来(lái)强(qiáng)人(rén)工智能、通用(yòng)人工(gōng)智能的重(zhòng)要技术创新(xīn),多模态大模型(xíng)已经在人工智能领域提出了很多年,业界(jiè)也有不少技术(shù)突破(pò),但是,多模态大模型进(jìn)一步往下走,算(suàn)力需求(qiú)呈几(jǐ)何式(shì)上升,一般的(de)算力基础设施很快将难以胜任。

从图(tú)像、文字、语音单(dān)独一项的训(xùn)练,到双(shuāng)模态、三模(mó)态的跃迁(qiān),让(ràng)人工智能可以灵活应(yīng)对不同模态的转化、像人与世界交(jiāo)互一(yī)样(yàng)自然,这方(fāng)面,由算力网络来驱动将有明显优势。

ChatGPT之后(hòu)又(yòu)一(yī)应用(yòng)杀疯了(le),AIGC或(huò)进入可控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能量

此(cǐ)外(wài),还有很多(duō)需要爆发式(shì)增长的算力来支撑的技术创新,将在人(rén)工智能算力网络支(zhī)撑下快(kuài)速(sù)推进。

AIGC已经(jīng)露出曙光(guāng),期待在(zài)大模型(xíng)和大算力的支持下AIGC能持续颠覆内容生产的方式,将创造的边(biān)际成(chéng)本降(jiàng)低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 广西大学唐纪良主任科员,广西大学唐记良

评论

5+2=