兩年前,在美國科羅拉多州博覽會藝術(shù)比賽上,,一幅名為《太空歌劇院》的作品拿了第一名。 此畫氣勢恢弘,、明暗有致,,頗有法國象征主義畫家古斯塔夫?莫羅的味道。只不過,,它不是人畫的,,而是由一位沒有任何繪畫基礎(chǔ)的參賽者,借助 AI 繪圖工具完成的,。 我們再把時間撥回到 2018 年,。彼時,一幅名為《埃德蒙?貝拉米畫像》的 AI 畫作在紐約佳士得拍賣行,,拍出了 40 多萬美元的高價,。這是第一幅被拍賣的人工智能作品,由此也標(biāo)志著 AI 藝術(shù)作品開始被市場認(rèn)可,。 如今,,AI 繪畫早已司空見慣,國內(nèi)外的 AI 玩家紛紛下場,,都要把這一賽道卷冒煙了,。 比如國外赫赫有名的 AI 生圖應(yīng)用 Midjourney、Stable Diffusion,、DALL-E,,動不動就上演神仙打架;國內(nèi)的字節(jié),、阿里,、騰訊等企業(yè)也隔三差五推出新產(chǎn)品、新功能,。 可是,,AI 繪畫應(yīng)用五花八門,對于 AI 愛好者來說,,如何實現(xiàn)更強(qiáng)的圖文匹配,?如何生成更具美感的圖像,?如何高效部署文生圖模型呢? 《AIGC 體驗派》第六期節(jié)目就來嘮嘮這件事兒,。 《AIGC 體驗派》視頻節(jié)目由火山引擎,、NVIDIA 聯(lián)手機(jī)器之心和 CMO CLUB 共同推出,匯聚了眾多營銷領(lǐng)域的專業(yè)人士,,共同探討 AIGC 技術(shù)的應(yīng)用,、思考與實踐。 在本期節(jié)目中,,兩位行業(yè)資深嘉賓將深入剖析高美感文生圖背后的技術(shù)鏈路,,手把手教大家如何實現(xiàn)更強(qiáng)的圖文匹配。
第六期節(jié)目邀請到兩位重磅嘉賓,,分別是豆包文生圖技術(shù)專家張亮、NVIDIA 解決方案架構(gòu)師趙一嘉,。 精彩內(nèi)容搶先看用戶只需輸入幾句簡單的提示詞,,AI 就能自動生成逼真細(xì)膩的畫作,。無論是古典油畫的細(xì)膩質(zhì)感,還是現(xiàn)代抽象藝術(shù)的自由表達(dá),,抑或是東方水墨畫的深遠(yuǎn)意境,,它都能游刃有余地進(jìn)行創(chuàng)作。它不僅能學(xué)習(xí)和模仿歷史上著名畫家的風(fēng)格,,也能創(chuàng)造出全新的藝術(shù)流派,,為用戶帶來前所未有的創(chuàng)作和交互體驗。 時至今日,,AI 繪畫更是進(jìn)化「成精」,,甚至到了真假難辨的地步。 例如,,這樣的: 或者這樣的: 也正是由于獨特的創(chuàng)作力和沉浸式的互動體驗,,AI 文生圖成了各大 AI 廠商競相爭奪的「香餑餑」。 例如,,字節(jié)一口氣推出了剪映,、星繪、即夢等 AI 產(chǎn)品,,無一例外,,它們都包含了文生圖能力,,而這些產(chǎn)品的背后,都離不開字節(jié)的豆包文生圖大模型,。 對于文生圖模型來說,,要想討得用戶「歡心」,無外乎三點:更強(qiáng)的圖文匹配,、更美的圖像效果和更快的生成體驗,。 那么,豆包文生圖大模型是如何實現(xiàn)更強(qiáng)的圖文匹配來滿足用戶的想法設(shè)計,?如何生成更具美感的圖像來提供更極致的用戶體驗,?如何更快速地出圖來滿足超大規(guī)模的服務(wù)調(diào)用? 這些問題的答案,,將在第六期《AIGC 體驗派》中揭曉,。 8月6日晚7點,來直播間圍觀「奇幻成像,,高美感文生圖背后的技術(shù)鏈路」,掃碼直達(dá)直播間,。 上期回顧 在第五期《AIGC 體驗派》的直播中,,火山引擎內(nèi)容安全與風(fēng)控負(fù)責(zé)人張建洋、NVIDIA 企業(yè)級開發(fā)者社區(qū)高級經(jīng)理何琨深入剖析 AIGC 在營銷領(lǐng)域的創(chuàng)新與安全問題,,分享如何在變革中實現(xiàn)業(yè)務(wù)的持續(xù)增長與穩(wěn)健發(fā)展,。 眾所周知,AIGC 技術(shù)正逐漸成為企業(yè)營銷一大創(chuàng)新利器,。它可以幫助營銷人以前所未有的速度創(chuàng)作天馬行空的營銷素材,,只需簡單輸入幾個關(guān)鍵詞或提示詞,就可以在短時間內(nèi)自動生成引人入勝的營銷文案,、圖片,、以及營銷視頻。 然而,,正如任何技術(shù)革新一樣,,AIGC 在提升營銷創(chuàng)意和效率的同時,也帶來了諸多安全問題,。 火山引擎內(nèi)容安全與風(fēng)控負(fù)責(zé)人張建洋以實際案例,,展示了火山引擎的 AI 技術(shù)如何為營銷人「保駕護(hù)航」。 張建洋表示,,大模型的幻覺讓輸出結(jié)果不完全可控,,由此導(dǎo)致營銷內(nèi)容存在各種潛在的內(nèi)容風(fēng)險。例如,,AIGC 技術(shù)創(chuàng)作的營銷文案含有「最好」,、「第一」,、「世界級」、「全網(wǎng)首發(fā)」等「絕對化」的用語,,生成的營銷圖片或視頻中可能含有低俗低質(zhì)的不良內(nèi)容,,它們一旦出現(xiàn)在廣告中,不僅會損害品牌形象,,還會引起公眾的反感,。 對此,火山引擎提供了一整套有針對性的內(nèi)容風(fēng)險檢測引擎,,通過其多模態(tài)內(nèi)容支持,、多樣化的風(fēng)險模型和實時風(fēng)險評估功能,為企業(yè)打造了一個全面,、高效的風(fēng)險管理解決方案,。 其中,針對營銷素材風(fēng)險多樣性的問題,,檢測引擎內(nèi)置了上百個風(fēng)險模型,。例如,適用于營銷文案的廣告用語檢測模型,,可以準(zhǔn)確判斷文案中是否含有絕對化用語,、虛假宣傳、以及誘導(dǎo)消費(fèi)的違規(guī)內(nèi)容,;而適用于營銷視頻的畫面質(zhì)量和版權(quán)檢測模型,,可以判斷視頻中是否包含不良畫面和低質(zhì)內(nèi)容,以及是否存在侵權(quán)可能,。 此外,,為了有效轉(zhuǎn)化目標(biāo)用戶,企業(yè)往往不惜投入重金開展各種營銷活動,,如新人獎勵,、任務(wù)獎勵等,以期提升用戶粘性,。然而,,這些充滿誘惑的獎勵機(jī)制,也可能成為黑產(chǎn)眼中的「肥肉」,,他們利用漏洞作弊,,將企業(yè)的營銷資金占為己有。 例如,,一家車企在開展線上營銷活動時,,遇到虛假助力和虛假試駕這兩大棘手問題。接入火山引擎智能風(fēng)控產(chǎn)品后,,短短兩個月,,他們就有效識別出異常行為 108 萬次,、異常賬戶超 3 萬個,異常設(shè)備 2 萬余臺,,直接止損金額達(dá) 50 萬元,,不僅有效降低了營銷費(fèi)用的浪費(fèi),還極大提升了業(yè)務(wù)轉(zhuǎn)化率,。 NVIDIA 企業(yè)級開發(fā)者社區(qū)高級經(jīng)理何琨則介紹了一款超酷的工具 ——NeMo Guardrails,,它就像是大語言模型的「保鏢」,避免它們胡言亂語,。 據(jù)何琨介紹,,NeMo Guardrails 是一個開源工具庫,通過添加可編程護(hù)欄來控制大型語言模型的輸出,,防止敏感話題,、不當(dāng)言論和惡意攻擊。它包括話題限定,、對話安全和攻擊防御三大護(hù)欄,,支持自定義對話邏輯,確保對話機(jī)器人的響應(yīng)符合特定請求和預(yù)定義邏輯,。 NeMo Guardrails 的工作流程包括接收用戶輸入,、匹配生成護(hù)欄、執(zhí)行對話邏輯流和生成機(jī)器人回答,。它使用 Colang 語言定義對話邏輯,這是一種用于對話式 AI 建模的語言,,具有高度可讀性和可擴(kuò)展性,。此外,NeMo Guardrails 可以與 LangChain 結(jié)合使用,,支持多種大語言模型對話引擎,,實現(xiàn)更安全的對話系統(tǒng)輸出。 |
|