豫优营销为企业提供网站建设、营销推广一体化的优质服务商
钻研精神、优质服务
蒙景传媒
当前位置:豫优科技 > AI原创 > >

豫优营销

About us

联系我们

CONTACT US

咨询热线

153-1756-9129

节假日无休

9:00--18:30

最新信息

用python写一个简单的脚本

来源:豫优营销 时间:2023-08-23 15:18:22 阅读

以下是一个使用Python编写的简单脚本,用于生成一篇800字的文章,文章内容与输入的关键词相关。
```python import requests from bs4 import BeautifulSoup import re import random
def get_article(keyword): # 使用百度搜索关键词获取相关文章 url = f"https://www.baidu.com/s?wd={keyword}" headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3" } response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, "html.parser") search_results = soup.find_all("div", class_="result c-container ") # 随机选择一篇文章进行内容提取 random_index = random.randint(0, len(search_results)-1) article_url = search_results[random_index].a["href"] article_response = requests.get(article_url, headers=headers) article_soup = BeautifulSoup(article_response.text, "html.parser") # 提取文章内容 article_content = article_soup.find_all("p") article_text = "" for paragraph in article_content: article_text += paragraph.get_text() # 去除文章中的特殊字符和HTML标签 article_text = re.sub(r"[^\w\s]", "", article_text) article_text = re.sub(r"<.*?>", "", article_text) # 截取文章的前800个字符作为最终生成的文章 final_article = article_text[:800] return final_article
if __name__ == "__main__": keyword = input("请输入关键词:") article = get_article(keyword) print(article) ```
这个脚本首先使用百度搜索提供的API来获取与输入关键词相关的搜索结果。然后,它从搜索结果中随机选择一篇文章,并提取该文章的内容。接下来,脚本会去除文章中的特殊字符和HTML标签,最后截取文章的前800个字符作为最终生成的文章。
请注意,这个脚本仅仅是一个简单的示例,可能无法处理一些特殊情况,例如搜索结果为空或无法访问某些网站。如果需要更加健壮和全面的功能,可能需要进一步完善和优化脚本。
    业务区域
  • 上海 北京 天津 深圳
  • 河南 河北 江苏 浙江
  • 湖南 湖北 广东 广西
  • 安徽 江西 福建 山西
    业务区域
  • 南京 苏州 义乌 杭州
  • 南通 厦门 宁波 昆山

上海豫优网络科技有限公司     沪ICP备2023015815号 网址:http://www.shyysem.com/
地址:上海市青浦区双浜路255号3楼    电话:15316022129 如有侵权联系:245647253@qq.com

友情链接:网站开发 产品拍摄 网站优化 上海seo 老照片修复 http://www.xiuzp.com/bdsitemap.xml http://www.shmjgs.com/bdsitemap.xml