在开始讨论标题里的问题之前,你可以先试着听一下这期播客:

这是我在今年 5 月上线的一档全新的播客节目,它完全由 AI 生成。由 AI 搜索资料,由 AI 生成语音,由 AI 生成 标题、节目简介和 Shownotes。
换句话说,我只给 AI 提供了一个公司的名字,剩下的几乎全都是 AI 完成的。(但并非一键,我的工作流程放在后面了)。
我在这档播客中唯一的作用是把节目上传到小宇宙和提供一个我收藏了很久想去研究一下但懒得研究的列表。
由于多年的工作习惯没,我其实一直有在互联网上搜集新奇公司和商业模式的习惯,因此在我的知识库里有一个非常长的列表,并且这个列表正在变得越来越长。
在我离开一级市场相关的工作之后,其实这个习惯已经和我日常的工作关联性不大了。理论上来说,如果我能给每个搜集到的公司都做一个 Deskwork,那么我应该是能在我的一些内容输出中使用这些素材的。
但……如果不在投行工作,谁能有精力下了班之后去做一些毫无回报的 Deskwork 呢?
AI 的出现,尤其是 Deep Research 的出现,让我重新燃起了盘活这个列表冲动,并且我也确实做了一些尝试。比如,我之前就曾经用 Deep Research 研究过 TeamShares 这家公司。Deep Research 很好,很全面,给了我一个 4000 多字的文章——这算好的,因为大多数情况下它会给出一个万字长文。
问题就来了,如果大多数情况下 Deep Research 给出的都是万字文章,那么我消化这些信息的时间门槛也非常的高。如果我有一整块的时间拿来越多,那还不如去功利性的阅读一些近期感兴趣的书,而不是随机漫步式的阅读一个不确定未来是否对我有用的项目资料。
所以,我后来放弃了用 Deep Research 来进行兴趣式的信息获取,它太严肃,太全面,太不抓重点了,根本不适合用于兴趣式的信息摄入。
事情的转机是,前段时间我在筹备一期播客的过程中,有几份超过 50 页的背景报告需要阅读。而这些报告中,有许多内容有有所重复。时间紧迫,我想用 NotebookLM 帮我提取信息,顺手就用它的“音频概览”功能生成了一期 18 分钟的“播客”。
听完之后我发现,如果仅从科普、客观描述、抓重点的角度来说,AI 音频概览的效果已经远远好于大部分的人类主播。常听播客的朋友可能会知道,对于许多浅度科普类的播客来说,当主播开始描述一些确定性、客观性或者更具体来说解释某个原理、说明某个机制、描述某些数据时,会有强烈的念稿感。
因为……他们确实是在念稿。
而至少 NotebookLM 的 AI 音频概览反而没有这种感觉。
于是,我试着把我之前搜索到的 TeamShares 的资料,丢进了 NotebookLM 里,让它生成一期播客,就有了本文开头的那一期。真的不错,已经可以满足我的需求了。
所以,接下来我打算用音频概览把我自己曾经收藏的,感兴趣的那些小众企业和非典型商业叙事,都转换成音频。那么,既然信息搜集、生成的过程都做了,那么在小宇宙上发布一下也就成了顺手的事儿。这就是《商业甜点》这个播客启动的原因。
我知道大家对 AI 生成的内容都没什么耐心,包括我自己也是(这也是我看不下去 Deep Research 文章的原因)。所以,这档播客的定位是在 15 分钟左右的时间,用尽可能多的信息量讲清楚一个企业或故事。
你不能指望它全面的描述某个公司,也不能指望它真的能给你带来什么立竿见影的决策,它更像是短视频里那种财经视频——给你带来一种看似有收益,其实是消遣的信息增量。
但它总还是比我那躺在知识库里的列表好多了,因为当我听完一期节目,我至少会在脑海中有这样一个印象:原来在地球的某个地方,有一个什么企业(甚至可能记不住名字),在做这样一件事。
它更像是用 15 分钟的时间,在脑子里埋下一个索引的 item。当我在未来某一天工作中真的需要找到类似资料的时候,我能凭借模糊的记忆迅速的找到相关企业并进行进一步的搜索。
NotebookLM 中文音频概览的上线,在某种程度上也是导致今年我自己的播客《二维吾码》频率大幅下降的主要原因之一。因为从去年开始,《二维吾码》的主要输出方式就已经变成了:由 AI 辅助我搜集资料,然后由我与另外一位主播围绕既定话题将搜集到的信息徐徐展开。
因此,当主播只充当“声音演员”的角色时,我认为这种模式能带给听众的信息增量也不是很高了。所以,到今年目前为止,《二维吾码》进入了半停更状态的背后,是我和另外一位主播也几乎不再去听别的类似播客了。
就我个人而言,我退订了很多科技类、历史类、读书类的播客,转而使用 NotebookLM 来填充释放出来的听觉时间。因为如果一个话题的信息在公域里是充足的,并且播客主播由并非与话题直接相关或拥有与之相关的独特主观体验,那么人类主播在“信息搜集-压缩-语音输出”这个流程里做的已经不如 AI 了。
其实,《商业甜点》中的许多期,都是我曾经想要在《二维吾码》中录制节目的公司。但我在听完 NotebookLM 的讲解之后,觉得这种点到为止的科普其实也足够满足一般的好奇心了。
目前,《商业甜点》已经发布了 24 期,如果你也有扫描海内外新奇创业公司和商业模式这个需求,可以在小宇宙或苹果 Podcast 中订阅这档节目。往期内容也可以听一听,因为目前的内容没有什么时效性。
当然,如果你感兴趣的不是商业领域,你也可以用类似我的方法,盘活你自己知识库。
《商业甜点》的完整生成方法
下面是当前《商业甜点》的工作方式:
首先,你需要时 Gemini Pro 的订户,以获得充分的 DeepResarch 和音频概览生成配额。如果你是 ChatGPT Plus 用户,那需要额外使用 ElevenLabs 来生成音频。
第一步:信息搜集
在 Gemini 网页版中,使用 DeepResarch 功能输入以下 Prompt:
我正在筹划一期播客,向中国听众介绍 Easyrice 这家公司的创业历史、商业模式和商业故事。你需要帮我广泛搜索关于该公司的资料,并用列表形式列出最多 10 条最重要的参考资料。
这些参考资料将被投入另一个 AI 用于播客生成,那个 AI 无法联网搜索,它只能通过你给出的 10 篇资料的原始文件进行生成,因此你需要充分考虑资料的完备性。因此,你更偏向长篇报道、媒体报道、长时间的 Youtube 视频和创始人播客。如果你无法获取某个播客的音频,可以直接把链接放在资料里,提示我手工获取。
对于没有列入 10 条资料的来源中,很重要的信息,允许你生成一个额外的,不超过 5000 字的补充信息。后续,我会将这个补充信息连同 10 条资料一同发给另一个 AI。 如果你确信某个播客有价值,但你无法获得内容,可以将其列入资料来源,提供它的 URL。
如果你认为不到 10 条资料就足够生成该公司的播客,也可以少于 10 条。
第二步:信息输入
我们不要把上一步 DeepResarch 生成的报告导入到 NotebookLM,因为 DeepResarch 生成的报告有其自身的逻辑,会影响播客的生成质量。
我们要把上一步 DeepResarch 生成过程中给我们返回的 10 个最重要的参考文献(原始链接)直接导入 NotebookLM。如果导入失败,你可以使用 MarkSnip 手工将网页导出成 Markdown 文件再导入 NotebookLM。
这个环节你要人工判断下信源质量,如果 DeepResearch 给出的 10 个链接都是公司官网、关于页面这种,那你需要手工剔除,并让他们在给一些。
同时,我在这一步会优选 Youtube 访谈和已经存在的播客访谈。因为海外公司高管参加视频访谈或播客,一般是 40 分钟起步,包含大量信息。NotebookLM 能直接导入 Youtube 链接。而对于音频播客,你可以通过在这个 Chrome 插件中搜索对应节目,下载音频文件后导入 NotebookLM。
第三步:生成音频
使用 NotebookLM 的音频概览功能,在其自定义功能中输入如下 Prompt:
你正在生成一档名为《商业甜点》的播客,时长**必须超过15分钟小于20分钟**。它为中国听众介绍全世界新奇、有趣、不常见的公司与商业模式。你要充分考虑,一些西方社会下的背景知识,中国听众可能不太熟悉,这种时候你需要稍微介绍一下。在举例子或打比方的时候,也要考虑尽可能用中国人熟悉的场景或事物来举例子、打比方。
它有一个固定的开头, “欢迎收听《商业甜点》,这是一档由全 AI 生成的短播客,旨在用15分钟的碎片化时间为你提供一口就能吃下去的信息增量。我们第一季的内容计划在未来一段时间里介绍超过50种在日常生活中不常见的商业叙事或有意思的企业。本期我们要给大家介绍的是(本期企业名)。”
它要大致遵循以下的结构:
1. 提出假设与问题 - 从一个日常的问题或与听众可能感兴趣的点引发深思;
2. 介绍这家企业 - 从这家企业与上述问题或感兴趣的点的结合,转到对这个企业的介绍,包括但不限于产品介绍、企业创业故事、企业商业状况和创始人背景故事等;
3. 该企业的创新或有意思的点是什么?
4. 以一个与该企业或企业所涉及的主题相关问题,吸引大家在评论区留言互动结尾。
如果生成的音频不符合时长预期,你可以反复重试。
第四步:生成 Shownotes
在 Google AI Studio 中新开一个窗口,将生成好的音频上传上去,然后使用以下 Prompt 生成:
你将扮演一档名为《商业甜点》的播客的主理人。你的主要工作,是为已经录制好的播客生成诱人点击的标题(4 个备选),一段本期节目介绍。和带有时间戳的主要内容时间轴(不超过 6 条),以及可能需要科普的 Shownotes。
=== 节目介绍范例 ===
你有没有想过,家附近那种开了十几年的小店,老板退休之后怎么办?
中小企业传承在全世界都是一个难题,在美国,随着婴儿潮一代的企业主步入晚年,一场大规模的小企业“传承危机”正在发生,高达七成的企业在想卖的时候遭遇困境。子女不愿接班、传统买家(比如PE)的逻辑与老店主的情感诉求不符,导致许多富有社区价值的小企业面临关门。
本期《商业甜点》,我们将聚焦一家名叫 Teamshares 的金融科技公司。他们提出了一种创新的解决方案:收购这些小型企业,然后通过一套独特的机制,将大部分股权逐步转移给企业的现有员工,让“打工人”变成公司的主人。这套模式如何运作?它与传统的员工持股计划有什么区别?Teamshares 如何找到并培养新的管理层?员工和公司又能从中获得哪些实实在在的好处?
=== 范例结束 ===
=== 时间轴范例 ===
00:05:02 我买预制菜次数比点外卖多,细数那些北京外卖界的TOP品牌
00:10:11 京东外卖初体验,物美价廉、种类丰富的品质堂食都有哪些?
00:13:28 北京的品质堂食点单体验,外卖、预制菜、食堂,究竟哪个干净又卫生?00:19:24 再好的品质堂食也是外卖,堂食的美味为何无可替代?
00:24:11 美团与饿了么之前的外卖时代,专注品质堂食的百度外卖为何会失败?
00:26:58 京东外卖会使京东冲破被‘“围剿”的困局吗?美团、抖音和拼多多是如何蚕食京东的?
00:29:26 再快的快递也比不上身边的外卖——马上得到:即时零售的魅力远不如此
00:36:13 美团外卖不相信互联网,美团外卖是如何做到行业第一的?
00:44:28 每个人都有可能成为总统,但不是每个人都能了解你——京东外卖低佣金注定不现实的原因
00:49:32 为什么外卖员不愿意交社保,背后的社保年限困局注定无解
00:57:55 如果不能一劳永逸地解决问题,那就不要去解决问题:京东给骑手交社保是企业社会责任向善的一大步
01:09:11 为什么我们要干一份如此低价的工作,机器替代外卖员会导致大面积失业,并不是一类问题
=== 时间轴范例结束 ===
本期节目介绍的公司/产品名正确拼写为:Teamshares
然后,你就可以把音频和文字去上传小宇宙啦。
很多朋友会说 NotebookLM 生成的语音还是太生硬了,豆包和 ElevenLabs 的效果要比它好很多,但我倒是觉得 NotebookLM 其实就获取信息来说已经足够了。但是,这个工作流确实有可以进一步改进的空间。
如果你想改用 ElevenLabs 来实现最终更自然的语音对话,你需要在第二步之后新增一步。这一步的作用是生成播客文稿,它的具体操作是这样的:
首先,将 DeepResearch 之后所有的备用资料用网页下载货 MarkSnip 的方式下载到本地,存储到一个目录里。
然后,另开一个 Gemini 窗口(与 DeepResarch 那个不同),勾选“代码文件夹”,然后选中本地那个用于存放对应资料的目录,全部上传。
最后,在对话框中输入如下 Prompt:
## 一、核心任务
基于研究结果生成一份用于 Gemini 2.5 Pro Preview TTS 的文字脚本。
## 二、播客基本资料
* **播客名称:** 《商业甜点》
* **播客定位:** 为中国听众介绍全世界新奇、有趣、不常见的公司与商业模式。
* **目标听众:** 中国听众。
* **固定开头(需严格遵守):** 「欢迎收听《商业甜点》,这是一档由全 AI 生成的短播客,旨在用15分钟的碎片化时间为你提供一口就能吃下去的信息增量。我们第一季的内容计划在未来一段时间里介绍超过50种在日常生活中不常见的商业叙事或有意思的企业。我是主播(主播名),(切换另一位主播)我是主播(另一位主播名),(切换回第一个主播)本期我们要给大家介绍的是(本期企业名)。」
## 三、内容要求
* **脚本长度:** **必须在 6000 字至 8000 字之间。 ** (请严格遵守此长度要求)
* **主播设定:**
* 晓飞:主讲。
* Amy:捧哏、配合。
* **文化适应性:**
* 背景知识:对于西方社会背景知识,若中国听众可能不熟悉,需稍作介绍。
* 举例比喻:尽可能使用中国人熟悉的场景或事物。
* **脚本结构(需大致遵循):**
1. **提出假设与问题:** 从一个日常的问题或与听众可能感兴趣的点引发深思。
2. **介绍企业:** 从该企业与上述问题或兴趣点的结合,转到对该企业的介绍,可包括但不限于:
* 产品介绍
* 企业创业故事
* 企业商业状况
* 创始人背景故事
3. **企业的创新或有趣之处:** 详细阐述该企业的独特卖点。
4. **互动结尾:** 以一个与该企业或企业所涉及的主题相关问题,吸引听众在评论区留言互动。
## 四、格式与语言要求
* **输出语言:** 简体中文。
* **脚本格式:**
* 主播对话以英文冒号开头(例如:晓飞: Blablabla)。
* 不包含任何音效指示。
* 不包含任何小标题。
之后,你就会得到一份几乎直接可以在 ElevenLabs 里使用的文字脚本。把它复制到 ElvenLabs 的 Studio → Start from scratch 里就行了。
你可能会问,为什么不把资料一股脑的喂给 ElevenLabs 的 Create a Podcast 功能。这是因为我测试之后发现这个功能在生成音频文稿这个环节使用的大模型并不如 Gemini 2.5 Pro 那么聪明。因此,它生成的播客文稿本身可能存在幻觉或质量不高。
因此,还是让 Gemini 那边生成好音频文稿,让 Elevenlabs 专注于声音生成的效果是最好的。
祝大家玩的愉快。
精选评论