2024-05-09

成功 AI 生產力軟體的 5 大特徵！矽谷頂級創投 a16z 談什麼是真正的 AI 原生工作流程

你一定看過媒體報導 AI 將大幅提升生產力，但究竟如何提升？許多創業者都在開發 AI 生產力工具，但一個好用的 AI 生產力軟體該長什麼樣？根據矽谷頂級創投 a16z 定義，成功 AI 生產力軟體其實有 5 大特徵！

〈科技觀察〉

很多人一輩子都搞不懂他們每天都在使用的那些辦公軟體。這一點也不奇怪。不論是做簡報、編輯影片或是修圖，現在常見的工具軟體常常都是一些已經問世數十年的產品。也就是說，它們的設計概念也有數十年之久。這些軟體常讓人感覺過於呆板，無法進行真正有價值的工作。

而矽谷頂級創投 a16z 最近發表一篇文章指出，生成式 AI 將為創業家提供機會，徹底重塑工作流程——並孕育出一批不只是 AI 輔助，而是真正 AI 原生（AI-native）的新型公司。這些公司將運用 AI 從零開始打造嶄新的產品，為使用者解決長期以來辦公軟體又貴又難用的痛苦！

舉例來說，Midjourney 和 ChatGPT 已經是 AI 生產力工具很好的初步案例。現在每個人都能成為程式設計師、製作人、設計師或音樂人，將 AI 真實應用於工作，縮小創意與技術之間的鴻溝。 a16z 認為，這將帶來全新的「專業消費者」（Prosumer）世代。

a16z 不僅指出工作流程將被「重塑」，更在文章中提到「remixable」（可重製）是未來 AI 工具的重點。這正是 MixerBox 的宗旨－－「重塑可能（Remix Possibilities），讓人人輕易享受科技」。

我們深入閱讀這篇文章，並經過重點摘譯，分享給大家。以下是文章【關鍵重點】與【精華摘譯】：

【關鍵重點】

在這篇文章中， a16z 將定義和解釋具備生成式 AI 原生工作流程（ Gen AI-native workflows）的產品有以下 5 大關鍵特徵：

1️⃣ 消滅「空白頁面」（blank page）的生成工具

2️⃣ 多模型（和多媒體！）組合

3️⃣ 能夠進行更多反覆修改的智能編輯器

4️⃣ 平台內優化（In-platform refinement）

5️⃣ 所有的輸出成果都可以重製（remixable）和可轉製（transposable）

【精華摘譯】

具備 AI 原生工作流程的產品是什麼？

所有具有 AI 原生工作流程的產品，都將共有一項關鍵特質：將尖端模型化為易於使用且高效能的使用者介面。

工作流程工具的使用者通常不關心產品背後的基礎設施為何，而僅在乎它如何幫助他們！雖然生成式 AI 使我們能夠邁向驚人的技術飛躍，但成功的產品仍將植基於對使用者及其痛點的深刻理解。

AI 能將哪些流程自動化？如果需要批准，關鍵的「決策點」又在哪裡？而最大的槓桿位置又在何處？

此類產品將擁有以下幾項關鍵特色：

AI 原生工作流程產品的關鍵特色

1️⃣ 消滅「空白頁面」（blank page）的生成工具

第一批消費者 AI 的成功案例是能夠將口語指令轉換成媒體輸出（如圖像、影片和文字）的工具。

專業消費者領域也將如此。這些工具或許能將真正的「空白頁面」進行轉換（例如將文字提示轉為簡報）、或是透過少量素材（如草圖或大綱），打造更為完整的產品。

有些公司將透過專有模型進行生成，而其他公司可能在幕後混合或拼接多個模型（開源、專有或透過 API）。其中一個例子是 Vizcom 的渲染工具。使用者可以輸入文字提示、草圖或 3D 模型，立即獲得逼真的渲染結果，並對其進一步修改。

2️⃣ 多模型（和多媒體！）組合

許多創意專案需要多種內容類型。例如，您可能需要結合圖像與文字、音樂與影片，或是動畫與配音。目前尚未有單一模型能生成所有這些資產類型。這為工作流程產品創造機會，讓使用者能在同一地點生成、修飾和組合不同內容類型。

HeyGen 的虛擬人物產品即是這類工具的範例。該公司結合自家的虛擬人物和口形同步模型，與 ElevenLabs 的文字轉語音 API，打造逼真的會說話影音虛擬人物。HeyGen 的產品還提供模板和類似 Canva 的編輯器，讓使用者能將虛擬人物置入簡報或影片中、建立投影片，或新增文字和其他素材，無需再將虛擬人物帶到 PowerPoint 或 Google 簡報。

3️⃣ 能夠進行更多反覆修改的智能編輯器

幾乎沒有工作成果是「一次到位」的，尤其是使用帶有固有隨機性的 AI 生成時，很難在第一次生成就得到完全滿意的結果。重新生成或修改提示是關鍵的流程，但卻又耗時且令人沮喪。

第一波 AI 生成產品並不允許任何反覆修改：你製作了一張圖像（或影片、或音樂）之後就到此為止了。若您使用相同的提示重新生成，會得到完全不同的結果。現在我們開始看到一些新功能，讓使用者在無需從頭開始的情況下，就能對現有輸出進行修改。Midjourney 的變化和縮放工具就是很好的例子。

4️⃣ 平台內優化（In-platform refinement）

智能編輯另一項關鍵（且相關）要素是優化；最後 10% 的打磨工作往往就是區分一件作品是好或是卓越的差別所在。但要（1）找出需要優化的地方，並且（2）無需切換至其他產品就能完成優化，的確是個挑戰。

AI 工作流程產品能協助使用者發現可以改進的地方，並自動進行改進。就想像蘋果相片上的「自動修圖」功能，但是適用於任何事物！最直接的應用就是像 Krea 這類平台所提供的超解析度功能。在同一個介面下，使用者能夠生成圖像或設計，再對其進行增強，使成品更臻完美。

ElevenLabs 的有聲書工作流程也是另一個良好範例。您可以使用該工具為特定角色生成聲音，朗讀書本的某些章節，然後透過調整句子或片語的停頓、穩定度或清晰度，將輸出優化到最佳狀態。