Python带你朗读网页-白红宇

Python带你朗读网页

阅读量：4227 次

发布时间：2019-05-26

本文共 1090 字，大约阅读时间需要 3 分钟。

万能的Python大法可以做很多有趣的事情，那我们今天来看看使用简单的Python来实现对一个网页的朗读吧！

首先我们需要装一些必要的库：

readability

它是用来提取网页内的内容的

pip install readability-lxml

640?wx_fmt=png

goose

它是一个文章提取器，我们用它来进行文章的提取

pip install goose3

640?wx_fmt=png

baidu-aip

百度提供的 Python SDK，接口文档：http://ai.baidu.com/docs#/TTS-Online-Python-SDK/top。

pip install baidu-aip

640?wx_fmt=png

对于百度的SDK我们也来简单的教大家用一下：

浏览器输入网址登陆：https://cloud.baidu.com/?from=console

找到语音识别：

640?wx_fmt=png

点进去创建应用：

640?wx_fmt=png

输入一些有用的创建信息：

640?wx_fmt=png

回到管理控制台，获取应用的APPID，apikey，secretkey：

640?wx_fmt=png

写代码的时候会用到，来调用这个接口

pydub

它可以用来生成音频文件，在 Windows 环境需要到 https://ffmpeg.zeranoe.com/builds/ 下载 FFmpeg，并将其配置到环境变量中（如果是使用ubuntu系统，还需要再安装下依赖apt-get install libav-tools）

需要在AudioSegment这个类中，把变量converter换成ffmpeg的路径：

640?wx_fmt=png

pip install pydub

640?wx_fmt=png

playsound

播放音频文件用到的包

pip install playsound

640?wx_fmt=png

现在所有的包都安装完毕了，我们可以来安心敲代码了，完成网页到音频的转换。

首先导入用到的包：

import uuid

import re

import os

import argparse

from pydub import AudioSegment

from aip import AipSpeech

from playsound import playsound

from goose3 import Goose

from goose3.text import StopWordsChinese

调用百度语言的api，传入APP_ID, API_KEY, SECRET_KEY：

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

定义函数：文字转化成声音：

640?wx_fmt=png

定义从网页获取文章的函数：

640?wx_fmt=png

将音频文件合并：

640?wx_fmt=png

下面我们就可以运行我们的程序了：

640?wx_fmt=png

640?wx_fmt=jpeg

感兴趣的扫个二维码吧！

转载地址：http://elnqi.baihongyu.com/

你可能感兴趣的文章

Ozone 与 HDDS 的区别与联系

查看>>

maven失败测试用例rerun插件使用方法

四行Python代码，你也能从图片上识别文字！

利用selenium爬取《西虹市首富影评》

ServiceFabric: 在Windows上创建容器应用并部署到ServiceFabric中

查看>>

paramiko——一个专门为Linux设计的模块

查看>>

一个有趣的python项目---一个好玩的网站

超越Selenium的存在---Pyppeteer

查看>>