作家许地山简介，许地山简介资料-橘子百科-橘子都知道

作家许地山简介，许地山简介资料 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器人ChatGPT火爆以来，微软公司创始人比尔·盖茨已(yǐ)多次公开谈论人工智能话题。在最近的一次采访(fǎng)中，他再次表示：“AI可能会让科技行(xíng)业迎来一次(cì)剧烈的洗牌”。

这(zhè)个结论是他(tā)在当(dāng)地时间2月20日接受(shòu)《In Good Company》节(jié)目(mù)专访(fǎng)时提出的。

他预期，AI的发(fā)展可能(néng)会威胁到谷歌的(de)市占率，因(yīn)为微软在AI方(fāng)面的行动相当迅(xùn)速(sù)。而最终科技巨头将(jiāng)把AI整合成用户的“全能助手”，包揽一切应用，与人们(men)进行沟通并提供建议，可以取代亚马(mǎ)逊、Siri或Outlook等应用。

大(dà)佬口中(zhōng)全(quán)能(néng)助手的到来可能尚(shàng)需(xū)时日，但由(yóu)ControlNet引发(fā)的又一次AI绘画浪潮，让AIGC在ChatGPT的(de)话题热点(diǎn)包围中(zhōng)杀出(chū)重围(wéi)。

ChatGPT之后又一应用杀疯了，AIGC或(huò)进入可控期，将洗(xǐ)牌科(kē)技行业(yè)？_黑料正能量(liàng)

ControlNet颠覆AI绘画(huà)新玩法

AIGC向可(kě)控靠近(jìn)

以AI绘画(huà)为代表的AIGC上(shàng)一(yī)次(cì)爆火的(de)时候，还(hái)是(shì)2022年8月(yuè)，在美(měi)国科罗拉多(duō)州举办的新兴数(shù)字艺术家竞赛(sài)中，一幅名为《太空歌剧院》的作品获奖。

随(suí)后(hòu)各(gè)大厂(chǎng)商(shāng)的(de)AI绘(huì)画软(ruǎn)件被广(guǎng)大网(wǎng)友(yǒu)熟知并(bìng)体验，Stable Diffusion便是(shì)其中代表(biǎo)。

用户们可以(yǐ)在应用中输入一组关键词或者一(yī)张照片，就(jiù)能获得一幅(fú)AI创作的画作。

作画的(de)关键就是(shì)所输入的文(wén)本。同(tóng)一组关键词也可以创作出很(hěn)多(duō)张风格不一样的(de)画作，这让(ràng)创作的过程就像开盲盒。

很多用(yòng)户很喜欢这种不确定(dìng)的惊喜，他们会将生成的美图(tú)当做头像。而另一部分喜(xǐ)欢翻看AI绘(huì)画的(de)“翻车(chē)”作品(pǐn)。在社交媒体上，许多用户分享AI“翻车现(xiàn)场(chǎng)”，例如(rú)，一位(wèi)网友的小(xiǎo)狗照(zhào)片(piàn)被AI画成了“肌肉男”，还有网友的个人照片被AI识(shí)别成(chéng)了建筑。

而如今随(suí)着ControlNet的出现与(yǔ)加持(chí)，以往AI绘画的填写关键词游戏可能要被颠覆了。

ControlNet是一位正在斯坦福读博的中国人(rén)张吕敏创作的一种基(jī)于控(kòng)制点的图像(xiàng)变形算法，主(zhǔ)要用于数字(zì)图(tú)像处理、计(jì)算(suàn)机视觉(jué)和计算(suàn)机图形(xíng)学(xué)等领(lǐng)域。

其(qí)SD插件(jiàn)一(yī)经发布，在短(duǎn)短的两天(tiān)内便成为(wèi)了AI绘(huì)画领域最新(xīn)的热点。

在此之前，大家用了很(hěn)多方法想让AI生成的(de)结果尽可(kě)能(néng)的符合要求，但是都(dōu)不(bù)尽如人意，它的出现(xiàn)代表着AI生成(chéng)开始进(jìn)入真正(zhèng)的可(kě)控(kòng)时期。

因(yīn)为ControlNet可(kě)以直(zhí)接提取画面的构图，人物的姿势和画面的深(shēn)度信息等。有了它(tā)的帮助(zhù)，就不用频繁的用提示词来碰运气，抽盲(máng)盒式(shì)的创作了(le)。

通(tōng)俗的(de)说ControlNet相(xiāng)当于给AI绘(huì)画加了(le)“魔法”，不少博主的作品已经获(huò)得了大量的浏览量，“viggo”就是(shì)其中之一，他用朋友的照(zhào)片直接带她(tā)们走进动漫世界。

viggo先(xiān)用StableDiffusion图片转文字(zì)。

再(zài)用Text2Prompt插件拓展找到(dào)对应的(de)关(guān)键词；最后用ControlNet插件绑定骨骼开始换关(guān)键词(cí)试效果。

通(tōng)过图片(piàn)就可以看出来，效果十分惊艳。

更厉害(hài)的是，除了真实的照(zhào)片，草图也可(kě)以(yǐ)加上“魔法”，知(zhī)乎大(dà)牛“DevPoint”和“逗砂”介绍到ControlNet还(hái)能实现线(xiàn)稿转全(quán)彩图。大神张吕敏其本尊也亲(qīn)自回(huí)应。

不得不说当下AIGC已经变得越来越(yuè)强大，甚至输出的作品都(dōu)已(yǐ)经能以假乱真了(le)。

难(nán)辨虚实，AIGC技术力爆发

警(jǐng)惕安(ān)全问题

近日，“苏州金鸡湖(hú)有(yǒu)游艇(tǐng)party”的消息火遍(biàn)网(wǎng)络，而经过警方辟(pì)谣(yáo)这所谓的“party”可能是全国第(dì)一起AI绘(huì)图诈骗。

由(yóu)于这个活(huó)动(dòng)里面给(gěi)出的美女(nǚ)照(zhào)片(piàn)都是AI制作的真人(rén)照(zhào)片绘图，因为太逼真，被大家当成真事传播了(le)。

不(bù)过(guò)仔细观察可以(yǐ)发现，活动发起(qǐ)者提供的照片(piàn)中有个很大的漏洞可以发现并非真人，而是(shì)AI绘(huì)图，那便是图片中女性的手指部(bù)分有的存在异常。

ChatGPT之(zhī)后(hòu)又一应用杀疯了，AIGC或进(jìn)入可控期，将(jiāng)洗牌科(kē)技行业(yè)？_黑(hēi)料正(zhèng)能量

有行(xíng)业人事表示：“现在因(yīn)为手指部分的(de)绘画算(suàn)法比较复杂，AI还不太会画人的手(shǒu)，但最新看到的图片已经有(yǒu)越来(lái)越完(wán)美(měi)的(de)AI模型出(chū)现，以后可能就完全没有漏洞了。”

类(lèi)似的AI作图诈骗(piàn)在国外也已有(yǒu)发生。据英国广播(bō)公司报道，土耳其地震(zhèn)期(qī)间，有(yǒu)Tiktok用户使用AI合(hé)成了儿童受灾的假照(zhào)片(piàn)发(fā)布(bù)到网络(luò)，以此诱骗善良的人打赏“捐助”从而实施诈骗。

目(mù)前随着技术发展，AIGC已(yǐ)经能做出(chū)真人照片般的绘图效果，如(rú)果这样的图片被用(yòng)来诈(zhà)骗，将非常可怕。

此外AIGC还引(yǐn)发了很多担忧，一方面(miàn)，批判者认为AI在(zài)“学习”了大(dà)量(liàng)前(qián)人的(de)作(zuò)品之后，其创(chuàng)作没有任何情(qíng)绪(xù)和灵魂，难以(yǐ)和人类的艺术创(chuàng)作相提并论(lùn)。

另一方面，AIGC背后(hòu)的(de)版权、目前都并没(méi)有得到有效的解决(jué)，还(hái)有AIGC会不(bù)会代替人(rén)类“至高无上”的(de)创(chuàng)意。

马斯克也强调(diào)，人工智能的(de)安全问题需要得到重视(shì)，太晚就来不及了。

AIGC下一(yī)站除了视频(pín)，还有远方

技术都(dōu)是(shì)有两面性(xìng)的，潜在的危(wēi)害并不能(néng)掩盖(gài)其(qí)光辉的贡献(xiàn)。现在(zài)看来，人工智能技术将是第四次工(gōng)业革命的核(hé)心驱动力量，将创造新(xīn)的增(zēng)长奇(qí)迹。

过(guò)去一年(nián)，人工智(zhì)能在技术和商业层面都(dōu)有了(le)巨大(dà)进展，AI绘画就(jiù)是人工智(zhì)能技术发生方向性改变的(de)一个代表。其下一站(zhàn)或许(xǔ)就是视频。

此前，Meta和谷歌先(xiān)后发布了(le)几条引爆科技圈的短视(shì)频。这些视频引发关注并非(fēi)内容做得多(duō)优秀，反而都非常(cháng)简单，比如一匹正在喝水(shuǐ)的马，一只画画(huà)的玩具熊，或者一段(duàn)骑摩托车(chē)的第(dì)一视角录像，随(suí)便(biàn)一(yī)个有手机的人都(dōu)可(kě)以(yǐ)随手录下一段。

但这些短视(shì)频的创作方式非(fēi)常简(jiǎn)单，创作(zuò)者(zhě)仅(jǐn)仅需(xū)要向AI输入一段话，甚至(zhì)只是说一下要求，AI就可以根(gēn)据需要生成一(yī)段(duàn)视(shì)频。

谷歌发布的两个AI生成视频分别来自于(yú)Imagen Video和(hé)Phenaki，前(qián)者主要突出(chū)的是(shì)高(gāo)清，与Meta的Make-A-Video没(méi)有太多的差(chà)别。

在(zài)Make-A-Video公布了AI生成的(de)视频后，AI圈就(jiù)已经玩了一波梗，一个能够(gòu)做出(chū)更(gèng)高清视频(pín)的AI还不足以在(zài)短时间内戳(chuō)中兴奋点。

Phenaki更加令(lìng)人震惊的地(dì)方在于，它可以制作出超过2分(fēn)钟的连贯(guàn)的(de)也有确切内容的视频(pín)，这(zhè)才是真正让人(rén)们(men)感(gǎn)到惊(jīng)喜的地方。因为无论AI生成的视(shì)频多么(me)高(gāo)清，也只(zhǐ)能是为(wèi)内容(róng)生产(chǎn)者提供一个灵感，一个素材，一个(gè)过场(chǎng)动画。

不过能够制(zhì)作出(chū)有具(jù)体剧情(qíng)内容的(de)视频就意味着，一(yī)些(xiē)视频创作(zuò)由AI代替人工完成已(yǐ)经(jīng)初(chū)步有了可能。

当下AI的发展速度(dù)已(yǐ)经超过大部分人的想象。内容产(chǎn)业的本质是供给创(chuàng)造(zào)需(xū)求，AIGC作为全新的内容生(shēng)产方式，可以为内容产业带来更新的(de)内容风格、更快的生(shēng)产速度(dù)，更低的生产成本(běn)，这无疑会驱(qū)动内容产业的大爆发。

除了(le)AI绘图(tú)、视频，AIGC技术还(hái)能应用于音乐、代码、机器人动(dòng)作等多种内容形式的生成。不难发现该项技术不仅在游戏等行(xíng)业能得到有(yǒu)效应(yīng)用，对(duì)于下(xià)一代互联网(wǎng)各(gè)种元(yuán)素的构建亦有关键意(yì)义。

从(cóng)商业化(huà)的角度来看，文(wén)化娱(yú)乐、教育、传媒等诸多领域，本身(shēn)就对基于AI的(de)可(kě)视(shì)化内容(róng)有强烈需求。

因此，AI绘(huì)画及视频或不是结果(guǒ)，而(ér)只(zhǐ)是AI进程中的一块重要拼图，有望在技术(shù)更新的加持下(xià)实现更(gèng)大的应用价值(zhí)。

AI从理解内容，走向了可以生(shēng)成内(nèi)容，甚至能够创造(zào)出独立价(jià)值(zhí)和独立视(shì)角的内容。AIGC的再次出圈，更代表着未来(lái)的先进生产力即(jí)将到来。

紧抓(zhuā)大(dà)模型与算力(lì)，牢固AIGC底座(zuò)

从技(jì)术的发(fā)展也可以看出，在(zài)语言(yán)大模型、图(tú)像大(dà)模型之后(hòu)，多(duō)模(mó)态大模型(xíng)已经成为了新(xīn)的趋势。

大模型被誉为当前人工智能发展(zhǎn)的(de)智能底座，是全球竞争最激烈(liè)的研究方(fāng)向之一(yī)，包括谷歌、亚马逊、百度、阿(ā)里、腾讯等(děng)众多头部(bù)企业(yè)都(dōu)在竞(jìng)相发(fā)力(lì)。

不过训练大模型的确价(jià)格不菲，以国盛证券发(fā)布的《ChatGPT需要多少算力》报告估(gū)算，GPT-3训练(liàn)一次的成本约为140万美(měi)元。而对于一些更大(dà)的LLM(大(dà)型语言(yán)模(mó)型)，训练成本则(zé)介于200万美元至1200万美元(yuán)高价之间(jiān)。

以(yǐ)ChatGPT在2023年1月的(de)独(dú)立(lì)访客平均(jūn)数1300万(wàn)计算(suàn)，其对应芯片(piàn)需求(qiú)为3万(wàn)多片英伟(wěi)达A100 GPU，初始(shǐ)投(tóu)入成(chéng)本约为8亿美元，每日仅电费就在5万美元左右。

此外(wài)不论是(shì)ChatGPT还是AIGC，都离不(bù)开庞大算力支持。在(zài)关注各类(lèi)大模型的发展同时，更应(yīng)该(gāi)关注算力网络的建设。

算力网络正驱动AI产业发展进入史(shǐ)诗级(jí)加速进(jìn)程(chéng)，让AIGC及通用AI这一人工(gōng)智能发展的终(zhōng)极目标离得更近(jìn)。

因为(wèi)算力可以对突破性技术(shù)创新提供大力(lì)的(de)支持。这方(fāng)面(miàn)，多(duō)模态(tài)大模型是典型(xíng)。作为(wèi)面向(xiàng)未来强(qiáng)人工(gōng)智能、通用(yòng)人工智(zhì)能的重要技术创(chuàng)新，多(duō)模(mó)态大模型(xíng)已经在人工智能领(lǐng)域(yù)提出了很多年，业界(jiè)也有不少技术(shù)突破，但是，多(duō)模态大模型进一步(bù)往下走，算力需求(qiú)呈几(jǐ)何式上升，一般的算力基础(chǔ)设施很(hěn)快将难以胜(shèng)任(rèn)。

从(cóng)图像、文字、语音单(dān)独一项的训练，到双模态(tài)、三模(mó)态的(de)跃迁，让人(rén)工智能(néng)可以灵活应对不同模态的(de)转化、像人与世界(jiè)交互一样(yàng)自(zì)然，这(zhè)方面，由算力网络来(lái)驱(qū)动将有明显优势。