GitHub 热门项目：PDF2Audio

GitHub 项目：PDF2Audio 仓库地址：https://github.com/lamm-mit/PDF2Audio 星级：1372 | 作者：拉姆米特项目描述：暂无描述 =================================================== 自述文件内容： # 将任何文档转换为音频播客、讲座、摘要等此代码可用于将 PDF 转换为音频播客、讲座、摘要等。它使用 OpenAI 的 GPT 模型进行文本生成和文本到语音的转换。您还可以编辑草稿记录（多次）并提供具体评论或有关如何调整或改进的总体指示。 ![图片](https://github.com/user-attachments/assets/ef8a5e84-d532-4e0e-b08b-fb7be2f98469) ## 特点 - 上传多个PDF文件 - 从不同的教学模板中进行选择（播客、讲座、摘要等） - 自定义文本生成和音频模型 - 为演讲者选择不同的声音 - 通过具体或一般性评论和/或对文本的编辑以及对模型的具体反馈来迭代草稿以进行改进 ## 在 Colab 中使用 [![在 Colab 中打开](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/lamm-mit/PDF2Audio/blob/main/PDF2Audio.ipynb) ## 本地安装请按照以下步骤使用 Conda 在本地计算机上设置 PDF2Audio： 1. 克隆存储库： ```` git 克隆 https://github.com/lamm-mit/PDF2Audio.git cd PDF2音频 ```` 2. 安装 Miniconda（如果尚未安装）： - 从[Miniconda网站](https://docs.conda.io/en/latest/miniconda.html)下载安装程序 - 按照您的操作系统的安装说明进行操作 - 验证安装： ```` 康达——版本 ```` 3.创建新的Conda环境： ```` conda 创建-n pdf2audio python=3.9 ```` 4.激活Conda环境： ```` conda 激活 pdf2audio ```` 5.安装所需的依赖项： ```` pip install -r 要求.txt ```` 6. 设置您的 OpenAI API 密钥：在项目根目录中创建一个 `.env` 文件并添加您的 OpenAI API 密钥： ```` OPENAI_API_KEY=your_api_key_here ```` ## 运行应用程序要运行 PDF2Audio 应用程序： 1. 确保您位于项目目录中并且 Conda 环境已激活： ```` conda 激活 pdf2audio ```` 2. 运行启动 Gradio 界面的 Python 脚本： ```` 蟒蛇应用程序.py ```` 3. 打开 Web 浏览器并转到终端中提供的 URL（通常为“http://127.0.0.1:7860”）。 4. 使用Gradio 界面上传PDF 文件并将其转换为音频。 ## 如何使用 1. 上传一个或多个PDF文件 2. 选择所需的说明模板 3. 根据需要自定义说明 4. 单击“生成音频”以创建您的音频内容 ## 通过? Hugging Face Spaces 访问 [lamm-mit/PDF2Audio](https://huggingface.co/spaces/lamm-mit/PDF2Audio) ## 结果示例 <音频控制> 您的浏览器不支持音频元素。

订阅66必读