第章56章 迴聲配音
你是黑科技大佬你不早說! 作者:量子星星 投票推薦 加入書簽 留言反饋
盡管淩晨三點多才睡,第二天早上, 邵逸明還是八點鍾準時起床, 把自己打扮得人模狗樣, 踩著九點鍾的線到達了公司。
邵逸明做動畫三年,做互聯網運營五年, 然後辭職開了自己的公司。這家公司規模很小, 至今也才隻有二十幾個人, 創業方向是這兩年逐漸興起的音頻付費。
公司好不容易走到了a輪融資階段,隻要拿到第一筆融資, 創業就初步成功了。如今正是最緊要的關頭,不能出現一絲差錯。
創投大會從上午十點進行到下午三點, 三點過後是投資方和創業者自由約談的時間。十點鍾,邵逸明帶著幾名員工來到了大會現場。
他的演講在十一點半左右,正好是上午場的壓軸位置。
聽到自己的名字, 他整了整衣領,自信滿滿地踏上舞台。
“這些年來,隨著互聯網的高速發展,信息傳播從兩級變成多級,去中心化概念越來越熱,也就導致了ugc平台的興起,ugc成為內容領域人人追逐的模式。”
“ugc是什麽用戶創造內容。不錯, 它具有很好的多樣性、娛樂性和豐富性, 所有做運營的都知道, 用戶才是最優質的內容輸出者。但是今天, 我要在這裏給它潑一盆冷水ugc模式不適用於音頻領域。”
“到今天為止,音頻領域的ugc內容有什麽歌曲翻唱、有聲書,其他的呢沒有了。這兩項是目前最成熟的音頻ugc,讓我們來看看它的現狀。”
“歌曲翻唱,很難通過歌曲本身來獲得盈利,必須通過直播等其他形式,也就是說,它本質上其實不屬於付費音頻,不是我們這個行業要做的事。至於有聲書,關於用戶自行製作的有聲書,侵權問題都還沒得到認定,盈利更是完全不可能的事。”
“其他的有聲內容,諸如有聲節目、廣播劇、原創歌曲,並不是用戶可以產出的內容。對業餘用戶來說,它的門檻太高了。我們看到現在有許多廣播劇愛好者,自發組成團體製作廣播劇,但是這種業餘團體,一般隻能出品一到兩期短篇劇集,無法維持一個長期穩定的更新狀態。這種是很難去做付費的,它不是一個優質可持續的付費內容。”
“諸位,ugc在音頻領域的路全都被堵死了,在我們這個行業,不存在ugc付費。”
邵逸明的演講,一上來就是dissugc,與行業內主流的“尋求ugc新模式”的聲音截然相反,很是吸引了一大批投資者的興趣。
他自覺火候已足,便轉移了話題,不再dissugc,開始講述自己公司的“打造精品gc”創業理念。
邵逸明做了五年運營,參與過的融資不下三次,他太清楚怎麽去吸引投資者了。風投大佬們除了看團隊、看產品,最喜歡的就是看一些玄玄乎乎的創業理念,哪怕團隊稀爛、產品還未成型,隻要理念到位,錢就可以到位。
邵逸明發言完畢,台下掌聲雷動,他心滿意足地走下去。
剛一迴到座位上,就有人來搭訕,“邵總,我們xx風投的代表想和您約一麵,請問下午有時間嗎”
邵逸明春風滿麵地應下一個又一個邀請,下午的安排從三點一直排到了八點。
與此同時,同一座城市的另一棟大廈裏,迴聲科技的員工正在忙碌。
程濤最近特別春風得意,他原本隻是迴聲的一個項目經理,和樓清焰簽訂外包合同的時候也沒想太多,覺得語音合成應該適用於迴聲配音這個項目,結果沒想到,何止是適用於迴聲配音,這個技術可以把整個迴聲都捧到天上去。
迴聲科技的研發方向是人工智能 語音,而樓清焰交出的語音合成軟件,在這個領域裏已經達到了登峰造極。
可以這麽說,這項技術到手,整個迴聲的所有研發項目全都廢了,必須來一次整體的更新換代。
那天見完樓清焰迴去,處在驚駭中久久不能迴神的程濤,不顧已經是下班時間,直接一個電話把迴聲總裁ca了起來。
總裁下班被ca自然非常憤怒,但在程濤的強烈要求下,還是忍著脾氣迴到公司。
但是看到語音合成軟件之後,他的一切脾氣都消失了,隻剩下怎麽壓都壓不住的驚濤駭浪。
他震驚了十分鍾,然後閉目思考三十分鍾,睜開眼睛第一件事,把程濤從項目經理提成了研發總監。
然後叫停了迴聲的一切在研項目。
連夜叫停,搞得整個公司人心惶惶,還以為公司是不是要倒閉了。
第二天,經曆驚濤駭浪洗禮的就變成了這些研發人員,他們被叫到一起參觀新的語音合成技術,然後一個個震驚到話都說不出來。
科技公司的研發部肯定和學術界掛鉤,這群人每天必看學術新聞,時刻關注前沿技術的進步。不是他們沒見識,而是無論是多麽權威的學術期刊,都不曾登載過如此驚世駭俗的技術。
是的驚世駭俗。
這項技術厲害到了什麽地步呢就算他們拿到手,也隻能短暫地獨享一段時間,然後大概會在各方壓力下被迫作出一些利益讓步。因為它實在是超前太多了,如果僅僅超前一點,還不至於這樣。
軟件代碼攤開在編譯器上,竟然沒有一個人能夠看懂,這個軟件的算法有60是全新的,實現算法的數學模型更是聞所未聞見所未見。
迴聲研究員震撼我全家。
這也是樓清焰願意把技術換給迴聲而不是自己做的原因之一。他連特效插件都保不住,怎麽可能保得住劃時代的語音合成如果在羽翼未豐前就捏住了這麽吊的技術,不被吞並幾乎不可能。
深空科技最懼怕的就是被巨頭吞並,君不見bat現在多麽愛玩大魚吃小魚的遊戲。為了讓深空可以堅持不融資,樓清焰都能費盡心機搞出二十億神話,自然不會允許這麽大的威脅出現。
迴聲就不一樣了,公司體量已經做起來,不是想吞就能吞的。
但是,把這種劃時代的技術交給其他公司,樓清焰不是吃了個大虧嗎
迴聲總裁也在思考這個問題,直到程濤對他說“你忘了嗎,我們和他簽的是對賭協議。”
不但是對賭協議,還是一份前所未有的“技術對賭”。
如果深空最後交給迴聲的軟件能完成xx功能,迴聲就必須履行xx條款,這樣的對賭協議。
迴聲總裁那時覺得隻是一個小項目的外包,並沒有太關注這個事,此時想起來,頗覺震撼,“那我們答應了什麽條款”
程濤深深地把頭低了下去。
當初看那些條款那麽不切實際,他以為深空也拿不準能不能開發出具體功能,隻是盡量往高裏寫。畢竟對賭嘛,上限越高越好,萬一就出奇跡了呢
誰知道,對他來說是奇跡的東西,對fire來說,全是順理成章。
迴聲總裁隻聽了第一個條款就夠夠的了,“什麽叫技術相關盈利10都給他這特麽不是憑空套走了我們公司10的股份”
不是他誇張,語音合成這個技術一出現,迴聲所有開發組勢必要學習,然後要把學來的東西應用在其他項目裏。迴聲科技所有的產品,都得在這項技術的指導下更新換代。樓清焰張口要來10的技術相關盈利,就和拿了他們10的股份沒有差別。
程濤隻好說“有時限的,有時限的”
比起這一條,其他條款也不算什麽了,總裁掃了一眼,也沒脾氣了,溫和地說“這是讓我們幫忙扶持他的繁星網這和我們自己做一個平台網站有什麽差別”
他真的很溫和。就是程濤沒敢接話。
這些都是前事了,時間迴到現在,語音合成和繁星網即將聯合發行,程濤正在監督前期工作。
是的,隻有程濤。至於fire,那是誰
深空不存在的。宣發工作全是迴聲在搞,深空隻管坐享其成。
程濤一邊坐在那等時間,一邊想起了樓清焰這個人。
一個失去繼承權被趕出家門的富二代,曾經的全平台第一網紅。
曾幾何時,他的人生就是炫富、扔錢、吃喝玩樂。他有一句著名的言論“每天早上醒來都有兩個煩惱,第一煩惱今天該怎麽燒錢,第二煩惱今天該懟誰。”
樓清焰的人品其實並沒有什麽汙點,也沒有不能容忍的黑曆史。他隻是得瑟了點、幼稚了點、憤青了點。
但他的人生太讓人羨慕了。隨心所欲,愛做什麽做什麽,永遠不用容忍不順心的事,看不服誰就罵誰,被一個兒控老爸全力寵著每個人都會或多或少產生一點嫉妒或者仇視,所以他的黑粉鋪天蓋地。
所以,當他跌落穀底的時候,盡管他才是那個受害者,人們卻隻感到幸災樂禍。
樓清焰的社交平台已經不更新了,每天仍有無數人追在下麵嘲諷,用著那些看到都覺得髒了眼睛的詞。
他們以這種嘲諷來發泄自己一整天積攢的憤怒,仿佛樓清焰的銷聲匿跡是他們對戰現實的某種勝利。
十二點,時間到了。軟件官網發布,電腦端和移動a掛上應用商城,廣告商發來ok的手勢,繁星網正式上線。
程濤看著發布出去的網站頁麵,忽然起了一身的雞皮疙瘩。
誰也不知道,那個已經銷聲匿跡許久的落魄二世祖,正在改變世界。
下午三點,邵逸明準時來到約好的地方,等待和投資方的會麵。
然而,他卻隻等來一個被放鴿子的通知。
“抱歉,我們經理臨時有事,不能過去了。投資的事情,以後有機會再談吧。”
有機會再談還有什麽機會
這分明就是拒絕
如果隻單單是一家的拒絕也就罷了,然而,在接下來的幾小時內,邵逸明收到了所有預約企業的拒絕。
晚上八點,不管他苦苦哀求多少遍,最後一家風投也還是沒來。
他一個人坐在餐廳裏,呆呆的,心想完了。
融資泡湯了。
凡是對付費音頻有點興趣的投資方,都參加了這次創投大會。如果在大會上沒能拉到投資,接下來再拉投資的希望就渺茫了。
付費音頻是新熱點,行業拓荒者數不勝數,且已經有了珠穆朗瑪那種成功的企業,沒錢就沒法高速鋪開業務,就搶不過別人,就注定失敗。
完了,一切都完了。
窗外華燈初上,邵逸明的臉反射在玻璃上,長達一個小時的時間,他腦中一片混亂。
一個小時後,他突然想為什麽
為什麽會被那麽多家風投連續放鴿子難道是背後有人在搞他
還未來得及仔細思考,員工電話打進來,大唿小叫地跟他說“邵哥你看到了嗎變天了怎麽辦我們怎麽辦啊”
“怎麽迴事”邵逸明這會兒異常冷靜,嘴裏迴答著電話,腦海裏還在想,誰會費這麽大力氣給他使絆子。
“快去看看新聞啊邵哥都一下午了難道你還不知道嗎”
邵逸明飛快掛掉電話打開新聞網站,一個不容忽視的大頭條掛在那裏。
“迴聲科技今日震撼發布,劃時代語音合成技術,我國人工智能已領先世界”
他呆了一瞬,才打開新聞,拉下去細看。
整篇新聞的口吻帶有一種明明很激動卻強自抑製的感覺,這小編也真是厲害,用特別理性客觀的文字把迴聲從上到下誇了一個遍,還不著痕跡地介紹了新軟件的各種功能。
軟件的名字很普通,就叫迴聲配音,和之前一模一樣。
隻不過之前的迴聲配音是個網頁程序,這迴有了客戶端。
“基於這種劃時代語音合成技術,迴聲科技目前僅發布迴聲配音一項產品,僅僅是這一款軟件,已經展現出令人震驚的功能效果。這一技術的後續開發非常值得期待。”
邵逸明看完軟件,強壓著內心的驚疑不定,去應用商店下載了手機a。
移動端的a設計非常簡單,就是輸入一段文字轉換成語音,帶有簡單的參數調試功能。
ai配音對硬件的要求相當高,手機端不能一次轉換太多內容,一次輸入僅限五十字。
邵逸明第一時間想到那個剛剛通過海選的動畫劇本,隨意從劇本中拉出一句詞輸入進去。
文字輸入完畢,蹦出挑選音色的選項,預置音色有最基本的童音、少年、青年、中年、老年,每一樣都分男女。
點擊某個音色,就直接輸出聲音。
僅僅是一句簡短的對話,邵逸明點開每一個音色來迴聽了三遍,越聽越覺得難以置信。
是語音合成,真正的語音合成。
和軟件唱歌不一樣,語音合成不是簡單的聲音排列組合,還需要自然語言處理,識別文字語義等等。現在,程序識別出了某句話的語義,根據語義配置了合理的起伏、韻律和聲調,然後播放出來。
逼真程度之高,就像是有一個真人在手機裏說話一樣
程序的表達不一定最動聽,但絕對是符合語境的,讓人找不出違和感。
換句話說,軟件不具有頂尖配音演員的實力,但是卻具有普通配音演員的能力。
邵逸明強自鎮定,安慰自己說平平無奇,沒有靈魂。別怕別怕。
機器終歸是機器,就算能配音,也隻是套路化模仿人的語氣,配不出有力量的情感表達。就像是演技拙劣的演員非要去演戲
他隨便選了一個音色,點擊確認,來到了下一個頁麵情感選擇。
下麵有四個滑條,分別是喜悅、激動、憤怒、恐懼。
邵逸明滑動這四個滑條的時候,感覺異常不真實,就好像在滑動圖片的rbg滑條一樣。
滑動之後,實時生成的語音果然出現了微妙的語氣變化。
這一頁下麵還有一樣小字“登陸電腦客戶端,調節更多情感維度,還可以自行設計維度模型,保存參數建立情感濾鏡。”
邵逸明猶豫了一下,沒有理會,點擊確定來到下一個頁麵。
這一步的名字叫“音頻液化”,選擇一個參數,在屏幕上生成一條曲線,手指塗抹就可以改變曲線的形狀,縱軸是該項參數,橫軸是時間。
音量是一條直線,用手指向上抹出一個小山包,山包對應的時間段的音量就會發生變化。
語調是曲線,可以用手指塗抹直接改變聲調的上揚或下抑。
語氣輕重是折線,可以製造強調聲或輕聲。
發聲位置,可以調出氣音、鼻音、胸腔共鳴、丹田發聲不同的效果。
還有音高、語速等等各種各樣的參數。原本“平平無奇沒有靈魂”的普通對話,可以在這個界麵往千奇百怪的方向去調整,輸出令人歎為觀止的多樣性成果。
第四步就是最後一步,完成這一步之後,係統就生成了3文件。
邵逸明聽了一遍又一遍,最後靠在椅子上,用手蓋住臉,長歎一口氣。
除了音色有些出入,這整句話和他所設想的一模一樣。
過了半天,他終於找到理由安慰自己“第四步也太複雜了,選擇困難症怕不是能玩一年。要是都這麽一句話一句話地調,猴年馬月才能完成一段配音”
厲害歸厲害,效率反而降低了。
這個想法剛一冒出來,a頁麵彈出提示“是否感覺參數太細致,建立音頻太麻煩,耗時過長下載c客戶端,體驗高效率ai配音。”
邵逸明立刻捕捉到關鍵點c端的功能更加強大
這個手機端時時刻刻都在給c端打廣告,很明顯隻是c端的一個推廣試驗版。
移動a已經強大如斯,c端的完整功能該有多麽恐怖
邵逸明立刻起身,連迴家都等不及,找了家最近的網吧,開機直接下載軟件。
比起手機端的簡易,c端顯得過於臃腫了。光纖網速下,軟件下載了整整一個小時,又安裝了半個小時,才總算弄好。
這是個付費軟件,全功能試用一周,簡單功能試用一個月。
邵逸明迫不及待地點進去,發現它比起手機端的確是強大了不少。
文本輸入方式變成了導入文本文件,沒有五十個字的限製,一次可以導入數千字的文本。
他直接登陸雲盤把自己的劇本下載下來,從裏麵選了一小段導入進去。
文本讀入後,顯示在左側的空白框裏,係統自動識別文本格式,廣告詞、小說、劇本,都會有不同的排列方式,對應不同的窗口布局。就像s一樣,根據畫畫、修圖、平麵設計不同的功能,會有不同的窗口預設。
文本一導入,軟件就蹦出提示,“監測到您的文本類型為劇本,是否切換為廣播劇模式”
切換之後,整個窗口布局大變樣,被分成了五個模塊。
左上是文本時間軸,一行一句文本,對應著音頻時間線。左下是角色窗口,從劇本中自動識別出的幾個角色已經整整齊齊排列在裏麵,點開之後是自定義角色卡,包括該角色的音色、情感濾鏡、語速語氣等等。
右上是屬性編輯器,右下是音效素材庫。
整個頁麵最下方是一條多軌道時間軸,可以對音頻進行整體的編輯。
這麽一看,這個軟件就已經專業得不行,ui設計功力不遜於adobe係列。
第一步依舊是選擇音色,但不再直接輸出音頻,而是選好音色後,填到角色卡裏。
邵逸明選完第一個角色的音色就悟了,他應該先把這些角色卡填滿,然後再去調整生成的音頻參數。
除了常規的語速語氣等,角色卡裏還有“情感濾鏡”選項,可以選預置的,也可以自定義。自定義窗口裏足有二十多個情感維度,開心、同情、嫉妒、失望二十多個滑條看得人眼花繚亂。
一個角色不可能永遠高興或永遠悲傷,邵逸明填完第一個角色,想了想,複製出一份,在角色名字後麵加了個括號低落,微調了一下參數,換了一個濾鏡,用來表示該角色不開心時的狀態。
很快,各個角色以及它們的複製體建立完畢,可以開始編輯詳細語句了。
每一句的可編輯參數都顯示在右側屬性編輯器裏,和角色卡裏的參數幾乎一模一樣,也有情感濾鏡選項。邵逸明立刻意識到,所謂的角色卡,其實就是一個參數模型。
屬性編輯器裏,唯一和角色卡不一樣的,就是音頻液化曲線,像手機a一樣,可以對某一個句子的不同時間點,進行最細微的調整。
編輯完角色、編輯完語句,軟件自動合成音頻,這段音頻顯示在右下方的音效素材庫裏,可以拖入多軌道編輯器進行剪輯。音效素材庫鏈接到雲端,用戶可以從中下載所需要的任何音效。當然,也可以自己導入。
到這裏為止,這個軟件隻是普通的配音軟件而已,功能無非是模仿人類的聲音,細化了各種可調參數。
用這個軟件來做廣播劇的話,隻要設定好角色,輸入劇本就可以輸出音頻。但這樣做出來的廣播劇非常“標準化”,用邵逸明的話說就是“平平無奇、沒有靈魂。”
如果對廣播劇進行精細化的微調,可以達成很好的效果,甚至能調出專業配音都達不到的水平,但那樣又太慢了,要一點一點摳到天荒地老。
邵逸明心想,這個軟件是不是有點雞肋一鍵生成的作品比較粗糙,精細製作的效率又不如人工配音。
當然,可以用這個軟件生成大量粗糙的ugc作品,人們對ugc作品的要求一向很低,就像網友自己利用遊戲製作的電影,再粗糙也有粉絲。
但它也隻能用大量粗糙作品填充低端音頻市場,或者出一兩部極其精細的“神作”,真正的中端精品內容,還是隻能由gc產出。
這個想法才剛冒出來,邵逸明突然發現,軟件裏還有一個功能。
“ai換聲,這是什麽”
他一下子打了個激靈,想到ai換臉、ai換人“草,不會是我想的那樣吧”
還真就是他想的那樣。
ai換聲的功能是,可以自己為某個角色配音,ai係統會學習他的聲學數據,換成係統預置音色。類似於變聲器的功能,但不是實時變聲。
弄懂這個功能之後,他直接摘下耳機,坐在椅子上,喃喃道“補齊了。”
軟件的最後一個缺陷也補齊了。
精細製作效率低不,我們可以ai換聲。嫌調參數麻煩,就自己配音,再換成角色的聲音。
邵逸明是做音頻內容運營的,他一下子就想出了,這個軟件發布後,廣播劇的製作模式將會發生多麽翻天覆地的改變。
在低端市場,隻要設定好角色、輸入劇本、適當添加音效,就可以一鍵生成廣播劇。這種廣播劇比較套路化,該有的語氣聲調樣樣不缺,但比較缺乏表現力。這就像是一部演技很差的偶像劇。
在中端市場,依舊是按照上述模式生成廣播劇,但在比較關鍵、比較需要表達力的篇幅上,可以由配音演員進行配音,再替換成角色的聲音。全程配音替換也可以,總之,隻要一個配音演員夠了,一個人就能完成一整個劇組的工作。這種廣播劇就像是偶爾演技爆發的普通電視劇。
在高端市場,用軟件對廣播劇進行不厭其煩的精細微調,可以完成非常高級的表達。這種廣播劇,大概就像演技爆棚的大電影,普遍意義上的“神作”。
一部廣播劇所需要的人才依舊是三種編劇、導演、配音,但團隊急劇縮水,最多隻需要三個人。
一名編劇足以自己完成一部低端劇集,再加上一名配音,可以完成中端或高端劇集,如果編劇本身就是配音那更好了。至於導演,可有可無。
兩個人能做,一個人也能做,超高效率的廣播劇內容產出,這就是、這就是
“這就是付費音頻的ugc模式”已改網址,已改網址,已改網址,大家重新收藏新網址,新新電腦版 ,大家收藏後就在新網址打開,以後老網址會打不開的,,
邵逸明做動畫三年,做互聯網運營五年, 然後辭職開了自己的公司。這家公司規模很小, 至今也才隻有二十幾個人, 創業方向是這兩年逐漸興起的音頻付費。
公司好不容易走到了a輪融資階段,隻要拿到第一筆融資, 創業就初步成功了。如今正是最緊要的關頭,不能出現一絲差錯。
創投大會從上午十點進行到下午三點, 三點過後是投資方和創業者自由約談的時間。十點鍾,邵逸明帶著幾名員工來到了大會現場。
他的演講在十一點半左右,正好是上午場的壓軸位置。
聽到自己的名字, 他整了整衣領,自信滿滿地踏上舞台。
“這些年來,隨著互聯網的高速發展,信息傳播從兩級變成多級,去中心化概念越來越熱,也就導致了ugc平台的興起,ugc成為內容領域人人追逐的模式。”
“ugc是什麽用戶創造內容。不錯, 它具有很好的多樣性、娛樂性和豐富性, 所有做運營的都知道, 用戶才是最優質的內容輸出者。但是今天, 我要在這裏給它潑一盆冷水ugc模式不適用於音頻領域。”
“到今天為止,音頻領域的ugc內容有什麽歌曲翻唱、有聲書,其他的呢沒有了。這兩項是目前最成熟的音頻ugc,讓我們來看看它的現狀。”
“歌曲翻唱,很難通過歌曲本身來獲得盈利,必須通過直播等其他形式,也就是說,它本質上其實不屬於付費音頻,不是我們這個行業要做的事。至於有聲書,關於用戶自行製作的有聲書,侵權問題都還沒得到認定,盈利更是完全不可能的事。”
“其他的有聲內容,諸如有聲節目、廣播劇、原創歌曲,並不是用戶可以產出的內容。對業餘用戶來說,它的門檻太高了。我們看到現在有許多廣播劇愛好者,自發組成團體製作廣播劇,但是這種業餘團體,一般隻能出品一到兩期短篇劇集,無法維持一個長期穩定的更新狀態。這種是很難去做付費的,它不是一個優質可持續的付費內容。”
“諸位,ugc在音頻領域的路全都被堵死了,在我們這個行業,不存在ugc付費。”
邵逸明的演講,一上來就是dissugc,與行業內主流的“尋求ugc新模式”的聲音截然相反,很是吸引了一大批投資者的興趣。
他自覺火候已足,便轉移了話題,不再dissugc,開始講述自己公司的“打造精品gc”創業理念。
邵逸明做了五年運營,參與過的融資不下三次,他太清楚怎麽去吸引投資者了。風投大佬們除了看團隊、看產品,最喜歡的就是看一些玄玄乎乎的創業理念,哪怕團隊稀爛、產品還未成型,隻要理念到位,錢就可以到位。
邵逸明發言完畢,台下掌聲雷動,他心滿意足地走下去。
剛一迴到座位上,就有人來搭訕,“邵總,我們xx風投的代表想和您約一麵,請問下午有時間嗎”
邵逸明春風滿麵地應下一個又一個邀請,下午的安排從三點一直排到了八點。
與此同時,同一座城市的另一棟大廈裏,迴聲科技的員工正在忙碌。
程濤最近特別春風得意,他原本隻是迴聲的一個項目經理,和樓清焰簽訂外包合同的時候也沒想太多,覺得語音合成應該適用於迴聲配音這個項目,結果沒想到,何止是適用於迴聲配音,這個技術可以把整個迴聲都捧到天上去。
迴聲科技的研發方向是人工智能 語音,而樓清焰交出的語音合成軟件,在這個領域裏已經達到了登峰造極。
可以這麽說,這項技術到手,整個迴聲的所有研發項目全都廢了,必須來一次整體的更新換代。
那天見完樓清焰迴去,處在驚駭中久久不能迴神的程濤,不顧已經是下班時間,直接一個電話把迴聲總裁ca了起來。
總裁下班被ca自然非常憤怒,但在程濤的強烈要求下,還是忍著脾氣迴到公司。
但是看到語音合成軟件之後,他的一切脾氣都消失了,隻剩下怎麽壓都壓不住的驚濤駭浪。
他震驚了十分鍾,然後閉目思考三十分鍾,睜開眼睛第一件事,把程濤從項目經理提成了研發總監。
然後叫停了迴聲的一切在研項目。
連夜叫停,搞得整個公司人心惶惶,還以為公司是不是要倒閉了。
第二天,經曆驚濤駭浪洗禮的就變成了這些研發人員,他們被叫到一起參觀新的語音合成技術,然後一個個震驚到話都說不出來。
科技公司的研發部肯定和學術界掛鉤,這群人每天必看學術新聞,時刻關注前沿技術的進步。不是他們沒見識,而是無論是多麽權威的學術期刊,都不曾登載過如此驚世駭俗的技術。
是的驚世駭俗。
這項技術厲害到了什麽地步呢就算他們拿到手,也隻能短暫地獨享一段時間,然後大概會在各方壓力下被迫作出一些利益讓步。因為它實在是超前太多了,如果僅僅超前一點,還不至於這樣。
軟件代碼攤開在編譯器上,竟然沒有一個人能夠看懂,這個軟件的算法有60是全新的,實現算法的數學模型更是聞所未聞見所未見。
迴聲研究員震撼我全家。
這也是樓清焰願意把技術換給迴聲而不是自己做的原因之一。他連特效插件都保不住,怎麽可能保得住劃時代的語音合成如果在羽翼未豐前就捏住了這麽吊的技術,不被吞並幾乎不可能。
深空科技最懼怕的就是被巨頭吞並,君不見bat現在多麽愛玩大魚吃小魚的遊戲。為了讓深空可以堅持不融資,樓清焰都能費盡心機搞出二十億神話,自然不會允許這麽大的威脅出現。
迴聲就不一樣了,公司體量已經做起來,不是想吞就能吞的。
但是,把這種劃時代的技術交給其他公司,樓清焰不是吃了個大虧嗎
迴聲總裁也在思考這個問題,直到程濤對他說“你忘了嗎,我們和他簽的是對賭協議。”
不但是對賭協議,還是一份前所未有的“技術對賭”。
如果深空最後交給迴聲的軟件能完成xx功能,迴聲就必須履行xx條款,這樣的對賭協議。
迴聲總裁那時覺得隻是一個小項目的外包,並沒有太關注這個事,此時想起來,頗覺震撼,“那我們答應了什麽條款”
程濤深深地把頭低了下去。
當初看那些條款那麽不切實際,他以為深空也拿不準能不能開發出具體功能,隻是盡量往高裏寫。畢竟對賭嘛,上限越高越好,萬一就出奇跡了呢
誰知道,對他來說是奇跡的東西,對fire來說,全是順理成章。
迴聲總裁隻聽了第一個條款就夠夠的了,“什麽叫技術相關盈利10都給他這特麽不是憑空套走了我們公司10的股份”
不是他誇張,語音合成這個技術一出現,迴聲所有開發組勢必要學習,然後要把學來的東西應用在其他項目裏。迴聲科技所有的產品,都得在這項技術的指導下更新換代。樓清焰張口要來10的技術相關盈利,就和拿了他們10的股份沒有差別。
程濤隻好說“有時限的,有時限的”
比起這一條,其他條款也不算什麽了,總裁掃了一眼,也沒脾氣了,溫和地說“這是讓我們幫忙扶持他的繁星網這和我們自己做一個平台網站有什麽差別”
他真的很溫和。就是程濤沒敢接話。
這些都是前事了,時間迴到現在,語音合成和繁星網即將聯合發行,程濤正在監督前期工作。
是的,隻有程濤。至於fire,那是誰
深空不存在的。宣發工作全是迴聲在搞,深空隻管坐享其成。
程濤一邊坐在那等時間,一邊想起了樓清焰這個人。
一個失去繼承權被趕出家門的富二代,曾經的全平台第一網紅。
曾幾何時,他的人生就是炫富、扔錢、吃喝玩樂。他有一句著名的言論“每天早上醒來都有兩個煩惱,第一煩惱今天該怎麽燒錢,第二煩惱今天該懟誰。”
樓清焰的人品其實並沒有什麽汙點,也沒有不能容忍的黑曆史。他隻是得瑟了點、幼稚了點、憤青了點。
但他的人生太讓人羨慕了。隨心所欲,愛做什麽做什麽,永遠不用容忍不順心的事,看不服誰就罵誰,被一個兒控老爸全力寵著每個人都會或多或少產生一點嫉妒或者仇視,所以他的黑粉鋪天蓋地。
所以,當他跌落穀底的時候,盡管他才是那個受害者,人們卻隻感到幸災樂禍。
樓清焰的社交平台已經不更新了,每天仍有無數人追在下麵嘲諷,用著那些看到都覺得髒了眼睛的詞。
他們以這種嘲諷來發泄自己一整天積攢的憤怒,仿佛樓清焰的銷聲匿跡是他們對戰現實的某種勝利。
十二點,時間到了。軟件官網發布,電腦端和移動a掛上應用商城,廣告商發來ok的手勢,繁星網正式上線。
程濤看著發布出去的網站頁麵,忽然起了一身的雞皮疙瘩。
誰也不知道,那個已經銷聲匿跡許久的落魄二世祖,正在改變世界。
下午三點,邵逸明準時來到約好的地方,等待和投資方的會麵。
然而,他卻隻等來一個被放鴿子的通知。
“抱歉,我們經理臨時有事,不能過去了。投資的事情,以後有機會再談吧。”
有機會再談還有什麽機會
這分明就是拒絕
如果隻單單是一家的拒絕也就罷了,然而,在接下來的幾小時內,邵逸明收到了所有預約企業的拒絕。
晚上八點,不管他苦苦哀求多少遍,最後一家風投也還是沒來。
他一個人坐在餐廳裏,呆呆的,心想完了。
融資泡湯了。
凡是對付費音頻有點興趣的投資方,都參加了這次創投大會。如果在大會上沒能拉到投資,接下來再拉投資的希望就渺茫了。
付費音頻是新熱點,行業拓荒者數不勝數,且已經有了珠穆朗瑪那種成功的企業,沒錢就沒法高速鋪開業務,就搶不過別人,就注定失敗。
完了,一切都完了。
窗外華燈初上,邵逸明的臉反射在玻璃上,長達一個小時的時間,他腦中一片混亂。
一個小時後,他突然想為什麽
為什麽會被那麽多家風投連續放鴿子難道是背後有人在搞他
還未來得及仔細思考,員工電話打進來,大唿小叫地跟他說“邵哥你看到了嗎變天了怎麽辦我們怎麽辦啊”
“怎麽迴事”邵逸明這會兒異常冷靜,嘴裏迴答著電話,腦海裏還在想,誰會費這麽大力氣給他使絆子。
“快去看看新聞啊邵哥都一下午了難道你還不知道嗎”
邵逸明飛快掛掉電話打開新聞網站,一個不容忽視的大頭條掛在那裏。
“迴聲科技今日震撼發布,劃時代語音合成技術,我國人工智能已領先世界”
他呆了一瞬,才打開新聞,拉下去細看。
整篇新聞的口吻帶有一種明明很激動卻強自抑製的感覺,這小編也真是厲害,用特別理性客觀的文字把迴聲從上到下誇了一個遍,還不著痕跡地介紹了新軟件的各種功能。
軟件的名字很普通,就叫迴聲配音,和之前一模一樣。
隻不過之前的迴聲配音是個網頁程序,這迴有了客戶端。
“基於這種劃時代語音合成技術,迴聲科技目前僅發布迴聲配音一項產品,僅僅是這一款軟件,已經展現出令人震驚的功能效果。這一技術的後續開發非常值得期待。”
邵逸明看完軟件,強壓著內心的驚疑不定,去應用商店下載了手機a。
移動端的a設計非常簡單,就是輸入一段文字轉換成語音,帶有簡單的參數調試功能。
ai配音對硬件的要求相當高,手機端不能一次轉換太多內容,一次輸入僅限五十字。
邵逸明第一時間想到那個剛剛通過海選的動畫劇本,隨意從劇本中拉出一句詞輸入進去。
文字輸入完畢,蹦出挑選音色的選項,預置音色有最基本的童音、少年、青年、中年、老年,每一樣都分男女。
點擊某個音色,就直接輸出聲音。
僅僅是一句簡短的對話,邵逸明點開每一個音色來迴聽了三遍,越聽越覺得難以置信。
是語音合成,真正的語音合成。
和軟件唱歌不一樣,語音合成不是簡單的聲音排列組合,還需要自然語言處理,識別文字語義等等。現在,程序識別出了某句話的語義,根據語義配置了合理的起伏、韻律和聲調,然後播放出來。
逼真程度之高,就像是有一個真人在手機裏說話一樣
程序的表達不一定最動聽,但絕對是符合語境的,讓人找不出違和感。
換句話說,軟件不具有頂尖配音演員的實力,但是卻具有普通配音演員的能力。
邵逸明強自鎮定,安慰自己說平平無奇,沒有靈魂。別怕別怕。
機器終歸是機器,就算能配音,也隻是套路化模仿人的語氣,配不出有力量的情感表達。就像是演技拙劣的演員非要去演戲
他隨便選了一個音色,點擊確認,來到了下一個頁麵情感選擇。
下麵有四個滑條,分別是喜悅、激動、憤怒、恐懼。
邵逸明滑動這四個滑條的時候,感覺異常不真實,就好像在滑動圖片的rbg滑條一樣。
滑動之後,實時生成的語音果然出現了微妙的語氣變化。
這一頁下麵還有一樣小字“登陸電腦客戶端,調節更多情感維度,還可以自行設計維度模型,保存參數建立情感濾鏡。”
邵逸明猶豫了一下,沒有理會,點擊確定來到下一個頁麵。
這一步的名字叫“音頻液化”,選擇一個參數,在屏幕上生成一條曲線,手指塗抹就可以改變曲線的形狀,縱軸是該項參數,橫軸是時間。
音量是一條直線,用手指向上抹出一個小山包,山包對應的時間段的音量就會發生變化。
語調是曲線,可以用手指塗抹直接改變聲調的上揚或下抑。
語氣輕重是折線,可以製造強調聲或輕聲。
發聲位置,可以調出氣音、鼻音、胸腔共鳴、丹田發聲不同的效果。
還有音高、語速等等各種各樣的參數。原本“平平無奇沒有靈魂”的普通對話,可以在這個界麵往千奇百怪的方向去調整,輸出令人歎為觀止的多樣性成果。
第四步就是最後一步,完成這一步之後,係統就生成了3文件。
邵逸明聽了一遍又一遍,最後靠在椅子上,用手蓋住臉,長歎一口氣。
除了音色有些出入,這整句話和他所設想的一模一樣。
過了半天,他終於找到理由安慰自己“第四步也太複雜了,選擇困難症怕不是能玩一年。要是都這麽一句話一句話地調,猴年馬月才能完成一段配音”
厲害歸厲害,效率反而降低了。
這個想法剛一冒出來,a頁麵彈出提示“是否感覺參數太細致,建立音頻太麻煩,耗時過長下載c客戶端,體驗高效率ai配音。”
邵逸明立刻捕捉到關鍵點c端的功能更加強大
這個手機端時時刻刻都在給c端打廣告,很明顯隻是c端的一個推廣試驗版。
移動a已經強大如斯,c端的完整功能該有多麽恐怖
邵逸明立刻起身,連迴家都等不及,找了家最近的網吧,開機直接下載軟件。
比起手機端的簡易,c端顯得過於臃腫了。光纖網速下,軟件下載了整整一個小時,又安裝了半個小時,才總算弄好。
這是個付費軟件,全功能試用一周,簡單功能試用一個月。
邵逸明迫不及待地點進去,發現它比起手機端的確是強大了不少。
文本輸入方式變成了導入文本文件,沒有五十個字的限製,一次可以導入數千字的文本。
他直接登陸雲盤把自己的劇本下載下來,從裏麵選了一小段導入進去。
文本讀入後,顯示在左側的空白框裏,係統自動識別文本格式,廣告詞、小說、劇本,都會有不同的排列方式,對應不同的窗口布局。就像s一樣,根據畫畫、修圖、平麵設計不同的功能,會有不同的窗口預設。
文本一導入,軟件就蹦出提示,“監測到您的文本類型為劇本,是否切換為廣播劇模式”
切換之後,整個窗口布局大變樣,被分成了五個模塊。
左上是文本時間軸,一行一句文本,對應著音頻時間線。左下是角色窗口,從劇本中自動識別出的幾個角色已經整整齊齊排列在裏麵,點開之後是自定義角色卡,包括該角色的音色、情感濾鏡、語速語氣等等。
右上是屬性編輯器,右下是音效素材庫。
整個頁麵最下方是一條多軌道時間軸,可以對音頻進行整體的編輯。
這麽一看,這個軟件就已經專業得不行,ui設計功力不遜於adobe係列。
第一步依舊是選擇音色,但不再直接輸出音頻,而是選好音色後,填到角色卡裏。
邵逸明選完第一個角色的音色就悟了,他應該先把這些角色卡填滿,然後再去調整生成的音頻參數。
除了常規的語速語氣等,角色卡裏還有“情感濾鏡”選項,可以選預置的,也可以自定義。自定義窗口裏足有二十多個情感維度,開心、同情、嫉妒、失望二十多個滑條看得人眼花繚亂。
一個角色不可能永遠高興或永遠悲傷,邵逸明填完第一個角色,想了想,複製出一份,在角色名字後麵加了個括號低落,微調了一下參數,換了一個濾鏡,用來表示該角色不開心時的狀態。
很快,各個角色以及它們的複製體建立完畢,可以開始編輯詳細語句了。
每一句的可編輯參數都顯示在右側屬性編輯器裏,和角色卡裏的參數幾乎一模一樣,也有情感濾鏡選項。邵逸明立刻意識到,所謂的角色卡,其實就是一個參數模型。
屬性編輯器裏,唯一和角色卡不一樣的,就是音頻液化曲線,像手機a一樣,可以對某一個句子的不同時間點,進行最細微的調整。
編輯完角色、編輯完語句,軟件自動合成音頻,這段音頻顯示在右下方的音效素材庫裏,可以拖入多軌道編輯器進行剪輯。音效素材庫鏈接到雲端,用戶可以從中下載所需要的任何音效。當然,也可以自己導入。
到這裏為止,這個軟件隻是普通的配音軟件而已,功能無非是模仿人類的聲音,細化了各種可調參數。
用這個軟件來做廣播劇的話,隻要設定好角色,輸入劇本就可以輸出音頻。但這樣做出來的廣播劇非常“標準化”,用邵逸明的話說就是“平平無奇、沒有靈魂。”
如果對廣播劇進行精細化的微調,可以達成很好的效果,甚至能調出專業配音都達不到的水平,但那樣又太慢了,要一點一點摳到天荒地老。
邵逸明心想,這個軟件是不是有點雞肋一鍵生成的作品比較粗糙,精細製作的效率又不如人工配音。
當然,可以用這個軟件生成大量粗糙的ugc作品,人們對ugc作品的要求一向很低,就像網友自己利用遊戲製作的電影,再粗糙也有粉絲。
但它也隻能用大量粗糙作品填充低端音頻市場,或者出一兩部極其精細的“神作”,真正的中端精品內容,還是隻能由gc產出。
這個想法才剛冒出來,邵逸明突然發現,軟件裏還有一個功能。
“ai換聲,這是什麽”
他一下子打了個激靈,想到ai換臉、ai換人“草,不會是我想的那樣吧”
還真就是他想的那樣。
ai換聲的功能是,可以自己為某個角色配音,ai係統會學習他的聲學數據,換成係統預置音色。類似於變聲器的功能,但不是實時變聲。
弄懂這個功能之後,他直接摘下耳機,坐在椅子上,喃喃道“補齊了。”
軟件的最後一個缺陷也補齊了。
精細製作效率低不,我們可以ai換聲。嫌調參數麻煩,就自己配音,再換成角色的聲音。
邵逸明是做音頻內容運營的,他一下子就想出了,這個軟件發布後,廣播劇的製作模式將會發生多麽翻天覆地的改變。
在低端市場,隻要設定好角色、輸入劇本、適當添加音效,就可以一鍵生成廣播劇。這種廣播劇比較套路化,該有的語氣聲調樣樣不缺,但比較缺乏表現力。這就像是一部演技很差的偶像劇。
在中端市場,依舊是按照上述模式生成廣播劇,但在比較關鍵、比較需要表達力的篇幅上,可以由配音演員進行配音,再替換成角色的聲音。全程配音替換也可以,總之,隻要一個配音演員夠了,一個人就能完成一整個劇組的工作。這種廣播劇就像是偶爾演技爆發的普通電視劇。
在高端市場,用軟件對廣播劇進行不厭其煩的精細微調,可以完成非常高級的表達。這種廣播劇,大概就像演技爆棚的大電影,普遍意義上的“神作”。
一部廣播劇所需要的人才依舊是三種編劇、導演、配音,但團隊急劇縮水,最多隻需要三個人。
一名編劇足以自己完成一部低端劇集,再加上一名配音,可以完成中端或高端劇集,如果編劇本身就是配音那更好了。至於導演,可有可無。
兩個人能做,一個人也能做,超高效率的廣播劇內容產出,這就是、這就是
“這就是付費音頻的ugc模式”已改網址,已改網址,已改網址,大家重新收藏新網址,新新電腦版 ,大家收藏後就在新網址打開,以後老網址會打不開的,,