橘子百科-橘子都知道橘子百科-橘子都知道

作家许地山简介,许地山简介资料

作家许地山简介,许地山简介资料 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来,微软公司创始人比尔·盖茨已(yǐ)多次公开谈论人工智能话题。在最近的一次采访(fǎng)中,他再次表示:“AI可能会让科技行(xíng)业迎来一次(cì)剧烈的洗牌”。

这(zhè)个结论是他(tā)在当(dāng)地时间2月20日接受(shòu)《In Good Company》节(jié)目(mù)专访(fǎng)时提出的。

他预期,AI的发(fā)展可能(néng)会威胁到谷歌的(de)市占率,因(yīn)为微软在AI方(fāng)面的行动相当迅(xùn)速(sù)。而最终科技巨头将(jiāng)把AI整合成用户的“全能助手”,包揽一切应用,与人们(men)进行沟通并提供建议,可以取代亚马(mǎ)逊、Siri或Outlook等应用。

大(dà)佬口中(zhōng)全(quán)能(néng)助手的到来可能尚(shàng)需(xū)时日,但由(yóu)ControlNet引发(fā)的又一次AI绘画浪潮,让AIGC在ChatGPT的(de)话题热点(diǎn)包围中(zhōng)杀出(chū)重围(wéi)。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将洗(xǐ)牌科(kē)技行业(yè)?_黑料正能量(liàng)

01

ControlNet颠覆AI绘画(huà)新玩法

AIGC向可(kě)控靠近(jìn)

以AI绘画(huà)为代表的AIGC上(shàng)一(yī)次(cì)爆火的(de)时候,还(hái)是(shì)2022年8月(yuè),在美(měi)国科罗拉多(duō)州举办的新兴数(shù)字艺术家竞赛(sài)中,一幅名为《太空歌剧院》的作品获奖。

随(suí)后(hòu)各(gè)大厂(chǎng)商(shāng)的(de)AI绘(huì)画软(ruǎn)件被广(guǎng)大网(wǎng)友(yǒu)熟知并(bìng)体验,Stable Diffusion便是(shì)其中代表(biǎo)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或(huò)进入可控期,将洗(xǐ)牌科技行业?_黑料正能量

用户们可以(yǐ)在应用中输入一组关键词或者一(yī)张照片,就(jiù)能获得一幅(fú)AI创作的画作。

作画的(de)关键就是(shì)所输入的文(wén)本。同(tóng)一组关键词也可以创作出很(hěn)多(duō)张风格不一样的(de)画作,这让(ràng)创作的过程就像开盲盒。

很多用(yòng)户很喜欢这种不确定(dìng)的惊喜,他们会将生成的美图(tú)当做头像。而另一部分喜(xǐ)欢翻看AI绘(huì)画的(de)“翻车(chē)”作品(pǐn)。在社交媒体上,许多用户分享AI“翻车现(xiàn)场(chǎng)”,例如(rú),一位(wèi)网友的小(xiǎo)狗照(zhào)片(piàn)被AI画成了“肌肉男”,还有网友的个人照片被AI识(shí)别成(chéng)了建筑。

而如今随(suí)着ControlNet的出现与(yǔ)加持(chí),以往AI绘画的填写关键词游戏可能要被颠覆了。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能(néng)量

ControlNet是一位正在斯坦福读博的中国人(rén)张吕敏创作的一种基(jī)于控(kòng)制点的图像(xiàng)变形算法,主(zhǔ)要用于数字(zì)图(tú)像处理、计(jì)算(suàn)机视觉(jué)和计算(suàn)机图形(xíng)学(xué)等领(lǐng)域。

其(qí)SD插件(jiàn)一(yī)经发布,在短(duǎn)短的两天(tiān)内便成为(wèi)了AI绘(huì)画领域最新(xīn)的热点。

在此之前,大家用了很(hěn)多方法想让AI生成的(de)结果尽可(kě)能(néng)的符合要求,但是都(dōu)不(bù)尽如人意,它的出现(xiàn)代表着AI生成(chéng)开始进(jìn)入真正(zhèng)的可(kě)控(kòng)时期。

因(yīn)为ControlNet可(kě)以直(zhí)接提取画面的构图,人物的姿势和画面的深(shēn)度信息等。有了它(tā)的帮助(zhù),就不用频繁的用提示词来碰运气,抽盲(máng)盒式(shì)的创作了(le)。

通(tōng)俗的(de)说ControlNet相(xiāng)当于给AI绘(huì)画加了(le)“魔法”,不少博主的作品已经获(huò)得了大量的浏览量,“viggo”就是(shì)其中之一,他用朋友的照(zhào)片直接带她(tā)们走进动漫世界。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正能量

viggo先(xiān)用StableDiffusion图片转文字(zì)。

再(zài)用Text2Prompt插件拓展找到(dào)对应的(de)关(guān)键词;最后用ControlNet插件绑定骨骼开始换关(guān)键词(cí)试效果。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技(jì)行(xíng)业?_黑(hēi)料正能量

通(tōng)过图片(piàn)就可以看出来,效果十分惊艳。

ChatGPT之(zhī)后又一应用杀疯了(le),AIGC或进(jìn)入可控期(qī),将洗牌(pái)科技(jì)行业?_黑料正能量

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗(xǐ)牌科(kē)技行业?_黑料(liào)正能量

更厉害(hài)的是,除了真实的照(zhào)片,草图也可(kě)以(yǐ)加上“魔法”,知(zhī)乎大(dà)牛“DevPoint”和“逗砂”介绍到ControlNet还(hái)能实现线(xiàn)稿转全(quán)彩图。大神张吕敏其本尊也亲(qīn)自回(huí)应。

ChatGPT之后又一应(yīng)用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能(néng)量

不得不说当下AIGC已经变得越来越(yuè)强大,甚至输出的作品都(dōu)已(yǐ)经能以假乱真了(le)。

02

难(nán)辨虚实,AIGC技术力爆发

警(jǐng)惕安(ān)全问题

近日,“苏州金鸡湖(hú)有(yǒu)游艇(tǐng)party”的消息火遍(biàn)网(wǎng)络,而经过警方辟(pì)谣(yáo)这所谓的“party”可能是全国第(dì)一起AI绘(huì)图诈骗。

由(yóu)于这个活(huó)动(dòng)里面给(gěi)出的美女(nǚ)照(zhào)片(piàn)都是AI制作的真人(rén)照(zhào)片绘图,因为太逼真,被大家当成真事传播了(le)

ChatGPT之后又一应用(yòng)杀疯(fēng)了(le),AIGC或进(jìn)入可(kě)控期,将洗牌科技行业(yè)?_黑料(liào)正(zhèng)能量

不(bù)过(guò)仔细观察可以(yǐ)发现,活动发起(qǐ)者提供的照片(piàn)中有个很大的漏洞可以发现并非真人,而是(shì)AI绘(huì)图,那便是图片中女性的手指部(bù)分有的存在异常。

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或进(jìn)入可控期,将(jiāng)洗牌科(kē)技行业(yè)?_黑(hēi)料正(zhèng)能量

有行(xíng)业人事表示:“现在因(yīn)为手指部分的(de)绘画算(suàn)法比较复杂,AI还不太会画人的手(shǒu),但最新看到的图片已经有(yǒu)越来(lái)越完(wán)美(měi)的(de)AI模型出(chū)现,以后可能就完全没有漏洞了。

类(lèi)似的AI作图诈骗(piàn)在国外也已有(yǒu)发生。据英国广播(bō)公司报道,土耳其地震(zhèn)期(qī)间,有(yǒu)Tiktok用户使用AI合(hé)成了儿童受灾的假照(zhào)片(piàn)发(fā)布(bù)到网络(luò),以此诱骗善良的人打赏“捐助”从而实施诈骗。

目(mù)前随着技术发展,AIGC已(yǐ)经能做出(chū)真人照片般的绘图效果,如(rú)果这样的图片被用(yòng)来诈(zhà)骗,将非常可怕。

此外AIGC还引(yǐn)发了很多担忧,一方面(miàn),批判者认为AI在(zài)“学习”了大(dà)量(liàng)前(qián)人的(de)作(zuò)品之后,其创(chuàng)作没有任何情(qíng)绪(xù)和灵魂,难以(yǐ)和人类的艺术创(chuàng)作相提并论(lùn)。

另一方面,AIGC背后(hòu)的(de)版权、目前都并没(méi)有得到有效的解决(jué),还(hái)有AIGC会不(bù)会代替人(rén)类“至高无上”的(de)创(chuàng)意。

马斯克也强调(diào),人工智能的(de)安全问题需要得到重视(shì),太晚就来不及了。

03

AIGC下一(yī)站除了视频(pín),还有远方

技术都(dōu)是(shì)有两面性(xìng)的,潜在的危(wēi)害并不能(néng)掩盖(gài)其(qí)光辉的贡献(xiàn)。现在(zài)看来,人工智能技术将是第四次工(gōng)业革命的核(hé)心驱动力量,将创造新(xīn)的增(zēng)长奇(qí)迹。

过(guò)去一年(nián),人工智(zhì)能在技术和商业层面都(dōu)有了(le)巨大(dà)进展,AI绘画就(jiù)是人工智(zhì)能技术发生方向性改变的(de)一个代表。其下一站(zhàn)或许(xǔ)就是视频。

此前,Meta和谷歌先(xiān)后发布了(le)几条引爆科技圈的短视(shì)频。这些视频引发关注并非(fēi)内容做得多(duō)优秀,反而都非常(cháng)简单,比如一匹正在喝水(shuǐ)的马,一只画画(huà)的玩具熊,或者一段(duàn)骑摩托车(chē)的第(dì)一视角录像,随(suí)便(biàn)一(yī)个有手机的人都(dōu)可(kě)以(yǐ)随手录下一段。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进(jìn)入可(kě)控期,将洗牌科技行业?_黑料正能量

但这些短视(shì)频的创作方式非(fēi)常简(jiǎn)单,创作(zuò)者(zhě)仅(jǐn)仅需(xū)要向AI输入一段话,甚至(zhì)只是说一下要求,AI就可以根(gēn)据需要生成一(yī)段(duàn)视(shì)频。

谷歌发布的两个AI生成视频分别来自于(yú)Imagen Video和(hé)Phenaki,前(qián)者主要突出(chū)的是(shì)高(gāo)清,与Meta的Make-A-Video没(méi)有太多的差(chà)别。

在(zài)Make-A-Video公布了AI生成的(de)视频后,AI圈就(jiù)已经玩了一波梗,一个能够(gòu)做出(chū)更(gèng)高清视频(pín)的AI还不足以在(zài)短时间内戳(chuō)中兴奋点。

Phenaki更加令(lìng)人震惊的地(dì)方在于,它可以制作出超过2分(fēn)钟的连贯(guàn)的(de)也有确切内容的视频(pín),这(zhè)才是真正让人(rén)们(men)感(gǎn)到惊(jīng)喜的地方。因为无论AI生成的视(shì)频多么(me)高(gāo)清,也只(zhǐ)能是为(wèi)内容(róng)生产(chǎn)者提供一个灵感,一个素材,一个(gè)过场(chǎng)动画。

不过能够制(zhì)作出(chū)有具(jù)体剧情(qíng)内容的(de)视频就意味着,一(yī)些(xiē)视频创作(zuò)由AI代替人工完成已(yǐ)经(jīng)初(chū)步有了可能。

当下AI的发展速度(dù)已(yǐ)经超过大部分人的想象。内容产(chǎn)业的本质是供给创(chuàng)造(zào)需(xū)求,AIGC作为全新的内容生(shēng)产方式,可以为内容产业带来更新的(de)内容风格、更快的生(shēng)产速度(dù),更低的生产成本(běn),这无疑会驱(qū)动内容产业的大爆发。

除了(le)AI绘图(tú)、视频,AIGC技术还(hái)能应用于音乐、代码、机器人动(dòng)作等多种内容形式的生成。不难发现该项技术不仅在游戏等行(xíng)业能得到有(yǒu)效应(yīng)用,对(duì)于下(xià)一代互联网(wǎng)各(gè)种元(yuán)素的构建亦有关键意(yì)义。

从(cóng)商业化(huà)的角度来看,文(wén)化娱(yú)乐、教育、传媒等诸多领域,本身(shēn)就对基于AI的(de)可(kě)视(shì)化内容(róng)有强烈需求。

因此,AI绘(huì)画及视频或不是结果(guǒ),而(ér)只(zhǐ)是AI进程中的一块重要拼图,有望在技术(shù)更新的加持下(xià)实现更(gèng)大的应用价值(zhí)。

AI从理解内容,走向了可以生(shēng)成内(nèi)容,甚至能够创造(zào)出独立价(jià)值(zhí)和独立视(shì)角的内容。AIGC的再次出圈,更代表着未来(lái)的先进生产力即(jí)将到来。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行业?_黑料正能量(liàng)

04

紧抓(zhuā)大(dà)模型与算力(lì),牢固AIGC底座(zuò)

从技(jì)术的发(fā)展也可以看出,在(zài)语言(yán)大模型、图(tú)像大(dà)模型之后(hòu),多(duō)模(mó)态大模型(xíng)已经成为了新(xīn)的趋势。

大模型被誉为当前人工智能发展(zhǎn)的(de)智能底座,是全球竞争最激烈(liè)的研究方(fāng)向之一(yī),包括谷歌、亚马逊、百度、阿(ā)里、腾讯等(děng)众多头部(bù)企业(yè)都(dōu)在竞(jìng)相发(fā)力(lì)。

不过训练大模型的确价(jià)格不菲,以国盛证券发(fā)布的《ChatGPT需要多少算力》报告估(gū)算,GPT-3训练(liàn)一次的成本约为140万美(měi)元。而对于一些更大(dà)的LLM(大(dà)型语言(yán)模(mó)型),训练成本则(zé)介于200万美元至1200万美元(yuán)高价之间(jiān)。

以(yǐ)ChatGPT在2023年1月的(de)独(dú)立(lì)访客平均(jūn)数1300万(wàn)计算(suàn),其对应芯片(piàn)需求(qiú)为3万(wàn)多片英伟(wěi)达A100 GPU,初始(shǐ)投(tóu)入成(chéng)本约为8亿美元,每日仅电费就在5万美元左右。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将洗(xǐ)牌科技行业?_黑料正能量(liàng)

此外(wài)不论是(shì)ChatGPT还是AIGC,都离不(bù)开庞大算力支持。在(zài)关注各类(lèi)大模型的发展同时,更应(yīng)该(gāi)关注算力网络的建设。

算力网络正驱动AI产业发展进入史(shǐ)诗级(jí)加速进(jìn)程(chéng),让AIGC及通用AI这一人工(gōng)智能发展的终(zhōng)极目标离得更近(jìn)。

因为(wèi)算力可以对突破性技术(shù)创新提供大力(lì)的(de)支持。这方(fāng)面(miàn),多(duō)模态(tài)大模型是典型(xíng)。作为(wèi)面向(xiàng)未来强(qiáng)人工(gōng)智能、通用(yòng)人工智(zhì)能的重要技术创(chuàng)新,多(duō)模(mó)态大模型(xíng)已经在人工智能领(lǐng)域(yù)提出了很多年,业界(jiè)也有不少技术(shù)突破,但是,多(duō)模态大模型进一步(bù)往下走,算力需求(qiú)呈几(jǐ)何式上升,一般的算力基础(chǔ)设施很(hěn)快将难以胜(shèng)任(rèn)。

从(cóng)图像、文字、语音单(dān)独一项的训练,到双模态(tài)、三模(mó)态的(de)跃迁,让人(rén)工智能(néng)可以灵活应对不同模态的(de)转化、像人与世界(jiè)交互一样(yàng)自(zì)然,这(zhè)方面,由算力网络来(lái)驱(qū)动将有明显优势。

ChatGPT之(zhī)后又一(yī)应用杀疯了(le),AIGC或进(jìn)入(rù)可控期,将洗(xǐ)牌科技行业(yè)?_黑料正能(néng)量

此外,还有很多需要爆发式增长的算力来支(zhī)撑的技术(shù)创新,将在(zài)人(rén)工(gōng)智能算(suàn)力网络支(zhī)撑下快(kuài)速推进。

AIGC已(yǐ)经露出曙光,期待在大模型和(hé)大算力的(de)支持下AIGC能持续颠覆内(nèi)容(róng)生产(chǎn)的方式,将创造的(de)边际成本降低,让(ràng)万众受(shòu)益。

未经允许不得转载:橘子百科-橘子都知道 作家许地山简介,许地山简介资料

评论

5+2=