GitHub 热门项目:PDF2Audio

2026-05-29 1 阅读 GitHub Trending
GitHub 项目:PDF2Audio 仓库地址:https://github.com/lamm-mit/PDF2Audio 星级:1372 | 作者:拉姆米特 项目描述:暂无描述 =================================================== 自述文件内容: # 将任何文档转换为音频播客、讲座、摘要等 此代码可用于将 PDF 转换为音频播客、讲座、摘要等。它使用 OpenAI 的 GPT 模型进行文本生成和文本到语音的转换。您还可以编辑草稿记录(多次)并提供具体评论或有关如何调整或改进的总体指示。 ![图片](https://github.com/user-attachments/assets/ef8a5e84-d532-4e0e-b08b-fb7be2f98469) ## 特点 - 上传多个PDF文件 - 从不同的教学模板中进行选择(播客、讲座、摘要等) - 自定义文本生成和音频模型 - 为演讲者选择不同的声音 - 通过具体或一般性评论和/或对文本的编辑以及对模型的具体反馈来迭代草稿以进行改进 ## 在 Colab 中使用 [![在 Colab 中打开](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/lamm-mit/PDF2Audio/blob/main/PDF2Audio.ipynb) ## 本地安装 请按照以下步骤使用 Conda 在本地计算机上设置 PDF2Audio: 1. 克隆存储库: ```` git 克隆 https://github.com/lamm-mit/PDF2Audio.git cd PDF2音频 ```` 2. 安装 Miniconda(如果尚未安装): - 从[Miniconda网站](https://docs.conda.io/en/latest/miniconda.html)下载安装程序 - 按照您的操作系统的安装说明进行操作 - 验证安装: ```` 康达——版本 ```` 3.创建新的Conda环境: ```` conda 创建-n pdf2audio python=3.9 ```` 4.激活Conda环境: ```` conda 激活 pdf2audio ```` 5.安装所需的依赖项: ```` pip install -r 要求.txt ```` 6. 设置您的 OpenAI API 密钥: 在项目根目录中创建一个 `.env` 文件并添加您的 OpenAI API 密钥: ```` OPENAI_API_KEY=your_api_key_here ```` ## 运行应用程序 要运行 PDF2Audio 应用程序: 1. 确保您位于项目目录中并且 Conda 环境已激活: ```` conda 激活 pdf2audio ```` 2. 运行启动 Gradio 界面的 Python 脚本: ```` 蟒蛇应用程序.py ```` 3. 打开 Web 浏览器并转到终端中提供的 URL(通常为“http://127.0.0.1:7860”)。 4. 使用Gradio 界面上传PDF 文件并将其转换为音频。 ## 如何使用 1. 上传一个或多个PDF文件 2. 选择所需的说明模板 3. 根据需要自定义说明 4. 单击“生成音频”以创建您的音频内容 ## 通过? Hugging Face Spaces 访问 [lamm-mit/PDF2Audio](https://huggingface.co/spaces/lamm-mit/PDF2Audio) ## 结果示例 <音频控制> 您的浏览器不支持音频元素。