MixerBox Blog

成功 AI 生產力軟體的 5 大特徵!矽谷頂級創投 a16z 談什麼是真正的 AI 原生工作流程

Facebook
LinkedIn
成功 AI 生產力軟體的 5 大特徵!矽谷頂級創投 a16z 談什麼是真正的 AI 原生工作流程

你一定看過媒體報導 AI 將大幅提升生產力,但究竟如何提升?許多創業者都在開發 AI 生產力工具,但一個好用的 AI 生產力軟體該長什麼樣?根據 矽谷頂級創投 a16z 定義,成功 AI 生產力軟體其實有 5 大特徵!


很多人一輩子都搞不懂他們每天都在使用的那些辦公軟體。這一點也不奇怪。不論是做簡報、編輯影片或是修圖,現在常見的工具軟體常常都是一些已經問世數十年的產品。也就是說,它們的設計概念也有數十年之久。這些軟體常讓人感覺過於呆板,無法進行真正有價值的工作。

矽谷頂級創投 a16z 最近發表一篇文章指出,生成式 AI 將為創業家提供機會,徹底重塑工作流程——並孕育出一批不只是 AI 輔助,而是真正 AI 原生(AI-native)的新型公司。這些公司將運用 AI 從零開始打造嶄新的產品,為使用者解決長期以來辦公軟體又貴又難用的痛苦!

舉例來說,Midjourney 和 ChatGPT 已經是 AI 生產力工具很好的初步案例。現在每個人都能成為程式設計師、製作人、設計師或音樂人,將 AI 真實應用於工作,縮小創意與技術之間的鴻溝。 a16z 認為,這將帶來全新的「專業消費者」(Prosumer)世代。

a16z 不僅指出工作流程將被「重塑」,更在文章中提到「remixable」(可重製)是未來 AI 工具的重點。這正是 MixerBox 的宗旨--「重塑可能(Remix Possibilities),讓人人輕易享受科技」。

我們深入閱讀這篇文章,並經過重點摘譯,分享給大家。以下是文章【 關鍵重點 】與【 精華摘譯 】:

【 關鍵重點 】

在這篇文章中, a16z 將定義和解釋具備生成式 AI 原生工作流程( Gen AI-native workflows)的產品有以下 5 大關鍵特徵:

1️⃣ 消滅「空白頁面」(blank page)的生成工具

2️⃣ 多模型(和多媒體!)組合

3️⃣ 能夠進行更多反覆修改的智能編輯器

4️⃣ 平台內優化(In-platform refinement)

5️⃣ 所有的輸出成果都可以重製(remixable)和可轉製(transposable)

GenAI-Native-Workflows-Inline

【 精華摘譯 】

具備 AI 原生工作流程的產品是什麼?

所有具有 AI 原生工作流程的產品,都將共有一項關鍵特質:將尖端模型化為易於使用且高效能的使用者介面。

工作流程工具的使用者通常不關心產品背後的基礎設施為何,而僅在乎它如何幫助他們!雖然生成式 AI 使我們能夠邁向驚人的技術飛躍,但成功的產品仍將植基於對使用者及其痛點的深刻理解。

 AI 能將哪些流程自動化?如果需要批准,關鍵的「決策點」又在哪裡?而最大的槓桿位置又在何處?

此類產品將擁有以下幾項關鍵特色:

AI 原生工作流程產品的關鍵特色

1️⃣ 消滅「空白頁面」(blank page)的生成工具

第一批消費者 AI 的成功案例是能夠將口語指令轉換成媒體輸出(如圖像、影片和文字)的工具。

專業消費者領域也將如此。這些工具或許能將真正的「空白頁面」進行轉換(例如將文字提示轉為簡報)、或是透過少量素材(如草圖或大綱),打造更為完整的產品。

有些公司將透過專有模型進行生成,而其他公司可能在幕後混合或拼接多個模型(開源、專有或透過 API)。其中一個例子是 Vizcom 的渲染工具。使用者可以輸入文字提示、草圖或 3D 模型,立即獲得逼真的渲染結果,並對其進一步修改。

2️⃣ 多模型(和多媒體!)組合

許多創意專案需要多種內容類型。例如,您可能需要結合圖像與文字、音樂與影片,或是動畫與配音。目前尚未有單一模型能生成所有這些資產類型。這為工作流程產品創造機會,讓使用者能在同一地點生成、修飾和組合不同內容類型。

HeyGen 的虛擬人物產品即是這類工具的範例。該公司結合自家的虛擬人物和口形同步模型,與 ElevenLabs 的文字轉語音 API,打造逼真的會說話影音虛擬人物。HeyGen 的產品還提供模板和類似 Canva 的編輯器,讓使用者能將虛擬人物置入簡報或影片中、建立投影片,或新增文字和其他素材,無需再將虛擬人物帶到 PowerPoint 或 Google 簡報。

HeyGens-Avatar-Editor-Inline

 3️⃣ 能夠進行更多反覆修改的智能編輯器

幾乎沒有工作成果是「一次到位」的,尤其是使用帶有固有隨機性的 AI 生成時,很難在第一次生成就得到完全滿意的結果。重新生成或修改提示是關鍵的流程,但卻又耗時且令人沮喪。

第一波 AI 生成產品並不允許任何反覆修改:你製作了一張圖像(或影片、或音樂)之後就到此為止了。若您使用相同的提示重新生成,會得到完全不同的結果。現在我們開始看到一些新功能,讓使用者在無需從頭開始的情況下,就能對現有輸出進行修改。Midjourney 的變化和縮放工具就是很好的例子。

4️⃣ 平台內優化(In-platform refinement)

智能編輯另一項關鍵(且相關)要素是優化;最後 10% 的打磨工作往往就是區分一件作品是好或是卓越的差別所在。但要(1)找出需要優化的地方,並且(2)無需切換至其他產品就能完成優化,的確是個挑戰。

AI 工作流程產品能協助使用者發現可以改進的地方,並自動進行改進。就想像蘋果相片上的「自動修圖」功能,但是適用於任何事物!最直接的應用就是像 Krea 這類平台所提供的超解析度功能。在同一個介面下,使用者能夠生成圖像或設計,再對其進行增強,使成品更臻完美。

ElevenLabs 的有聲書工作流程也是另一個良好範例。您可以使用該工具為特定角色生成聲音,朗讀書本的某些章節,然後透過調整句子或片語的停頓、穩定度或清晰度,將輸出優化到最佳狀態。

Kira-Zoom-Feature-Inline

5️⃣ 所有的輸出成果都可以重製(remixable)和可轉製(transposable)

AI 使內容獨一無二的靈活彈性——每一件內容都可能成為下一次修改的「起點」。只要您曾在 Midjourney 或 ChatGPT 中複製並微調他人的提示內容,就等於參與了這種做法。

專注於此靈活性的平台,或許能打造出更穩固且更具黏著力的產品。對於最初的創作者而言,能夠跨媒體形式轉化作品是極有價值的,例如將影片轉為部落格文章,或將文字說明轉為示範動畫影片。這正是 Gamma 出版平台的核心功能。使用者可以由提示或上傳檔案生成簡報、文件或網頁,並視需求切換格式。

這些產品能讓使用者公開自己的工作流程,供他人加以二次修改。這可能是一系列提示或模型組合 —— 或者對於較不擅長技術的使用者,只需設置「複製」按鈕即可模仿特定輸出或風格。


參考來源: https://a16z.com/the-future-of-prosumer-the-rise-of-ai-native-workflows/

體驗 MixerBox AI: mixerbox.ai

想看到更多 MixerBox AI 最新消息: MixerBox 粉絲專頁 先追蹤起來!

👉👉〈科技觀察〉系列文章:

吳恩達:AI agent 自動化工作流程今年有望帶動大規模 AI 進展,重要性可能超過發展大模型

2024 年 AI 領域開發重點:AI 分身開發潮正在來臨?

YC 創辦人 Paul Graham :從用戶身上學到致勝的關鍵

AI 時代的 5 大機會,你掌握到了嗎?

探索更多來自 MixerBox Blog 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading