Python爬虫全网搜索并下载音乐

开发 后端
今天的最早的需求是来自于 如何免费[白嫖]下载全网优质音乐 ,我去b站上面搜索到了一个大牛做过的一个歌曲搜索神器。

[[393482]]

现在写一篇博客总是喜欢先谈需求或者本内容的应用场景,是的,如果写出来的东西没有任何应用价值,确实也没有实际意义。今天的最早的需求是来自于 如何免费[白嫖]下载全网优质音乐 ,我去b站上面搜索到了一个大牛做过的一个歌曲搜索神器,界面是这样的:

确实很好用的,而且涵盖了互联网上面大多数主流的音乐网站,涉及到的版本也很多,可谓大而全,但是一个技术人的追求远远不会如此,于是我就想去了解其中背后的原理,因为做过网络爬虫的人都知道,爬虫只能爬取某一页或者某些页的网站资源,所以我很好奇它背后是怎么实现的?

笔者一直以来都是做的基于Python3.7版本的网络爬虫,所以本文也是基于此来学习记录的。首先爬取的网站不是对应的音乐网站,而是一个 音乐直链搜索 ,那里汇聚了大多数音频音乐的解析功能,界面如下:

所以自制一个搜索引擎的思想也很直观了,那就是利用第三方的接口,直接对该服务器发起请求即可,然后将获取的数据进行解析保存。这里以最近比较火的歌曲“白月光与朱砂痣”下载为例:

解析的结果如上,获取的数据格式是 json 类型,并且除了要有歌名以外,还要有音乐平台。

源代码实现如下:

  1. import requests 
  2. import jsonpath 
  3. import os 
  4. ""
  5.     1.url 
  6.     2.模拟浏览器请求 
  7.     3.解析网页源代码 
  8.     4.保存数据 
  9. ""
  10. def song_download(url,title,author): 
  11.     # 创建文件夹 
  12.     os.makedirs("music",exist_ok=True
  13.     path = 'music\{}.mp3'.format(title) 
  14.     print('歌曲:{0}-{1},正在下载...'.format(title,author)) 
  15.     # 下载(这种读写文件的下载方式适合少量文件的下载) 
  16.     content = requests.get(url).content 
  17.     with open(file = title + author + '.mp3',mode='wb'as f: 
  18.         f.write(content) 
  19.     print('下载完毕,{0}-{1},请试听'.format(title,author)) 
  20.  
  21. def get_music_name(): 
  22.     ""
  23.     搜索歌曲名称 
  24.     :return
  25.     ""
  26.     name = input("请输入歌曲名称:"
  27.     print("1.网易云:netease\n2.QQ:qq\n3.酷狗:kugou\n4.酷我:kuwo\n5.百度:baidu\n6.喜马拉雅:ximalaya"
  28.     platfrom = input("输入音乐平台类型:"
  29.     print("-------------------------------------------------------"
  30.     url = 'https://music.liuzhijin.cn/' 
  31.     headers = { 
  32.         "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36"
  33.         # 判断请求是异步还是同步 
  34.         "x-requested-with":"XMLHttpRequest"
  35.     } 
  36.     param = { 
  37.         "input":name
  38.         "filter":"name"
  39.         "type":platfrom, 
  40.         "page": 1, 
  41.     } 
  42.     res = requests.post(url=url,data=param,headers=headers) 
  43.     json_text = res.json() 
  44.  
  45.     title = jsonpath.jsonpath(json_text,'$..title'
  46.     author = jsonpath.jsonpath(json_text,'$..author'
  47.     url = jsonpath.jsonpath(json_text, '$..url'
  48.     if title: 
  49.         songs = list(zip(title,author,url)) 
  50.         for s in songs: 
  51.             print(s[0],s[1],s[2]) 
  52.         print("-------------------------------------------------------"
  53.         index = int(input("请输入您想下载的歌曲版本:")) 
  54.         song_download(url[index],title[index],author[index]) 
  55.     else
  56.         print("对不起,暂无搜索结果!"
  57.  
  58. if __name__ == "__main__"
  59.     get_music_name() 

 演示一下运行效果:

 然后文件下就会出现对应的歌曲 .mp3 文件

 并且每次的歌曲检索都是在PyCharm专业版的控制台中进行的,这样的用户体验就非常糟糕,所以针对以上两个问题,我对源代码进行了改进。

  1. # 导入模块 
  2. from tkinter import * 
  3. import requests 
  4. import jsonpath 
  5. import os 
  6. from urllib.request import urlretrieve 
  7.  
  8. # 2.功能实现 
  9. ""
  10.     1.url 
  11.     2.模拟浏览器请求 
  12.     3.解析网页源代码 
  13.     4.保存数据 
  14. ""
  15. def song_download(url,title,author): 
  16.     # 创建文件夹 
  17.     os.makedirs("music",exist_ok=True
  18.     path = 'music\{}.mp3'.format(title) 
  19.     text.insert(END,'歌曲:{0}-{1},正在下载...'.format(title,author)) 
  20.     # 文本框滑动 
  21.     text.see(END
  22.     # 更新 
  23.     text.update() 
  24.     # 下载 
  25.     urlretrieve(url,path) 
  26.     text.insert(END,'下载完毕,{0}-{1},请试听'.format(title,author)) 
  27.     # 文本框滑动 
  28.     text.see(END
  29.     # 更新 
  30.     text.update() 
  31.  
  32. def get_music_name(): 
  33.     ""
  34.     搜索歌曲名称 
  35.     :return
  36.     ""
  37.     name = entry.get() 
  38.     platfrom = var.get() 
  39.     # name = '白月光与朱砂痣' 
  40.     url = 'https://music.liuzhijin.cn/' 
  41.     headers = { 
  42.         "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36"
  43.         # 判断请求是异步还是同步 
  44.         "x-requested-with":"XMLHttpRequest"
  45.     } 
  46.     param = { 
  47.         "input":name
  48.         "filter":"name"
  49.         "type":platfrom, 
  50.         "page": 1, 
  51.     } 
  52.     res = requests.post(url=url,data=param,headers=headers) 
  53.     json_text = res.json() 
  54.  
  55.     title = jsonpath.jsonpath(json_text,'$..title'
  56.     author = jsonpath.jsonpath(json_text,'$..author'
  57.     url = jsonpath.jsonpath(json_text, '$..url'
  58.     print(title,author,url) 
  59.     song_download(url[0],title[0],author[0]) 
  60.  
  61.  
  62. # 1.用户界面 
  63. # 创建画板 
  64. root = Tk() 
  65. # 设置窗口标题 
  66. root.title('全网音乐下载器'
  67. # 设置窗口大小以及出现的位置 
  68. root.geometry('560x450+400+200'
  69. # 标签组件 
  70. label = Label(root,text="请输入下载的歌曲:",font=('楷体',20)) 
  71. # 定位与布局 
  72. label.grid(row=0) 
  73. # 输入框组件 
  74. entry = Entry(root,font=('宋体',20)) 
  75. entry.grid(row=0,column=1) 
  76. # 单选按钮 
  77. var = StringVar() 
  78. r1 = Radiobutton(root,text='网易云',variable=var,value='netease'
  79. r1.grid(row=1,column=0) 
  80. r2 = Radiobutton(root,text='QQ',variable=var,value='qq'
  81. r2.grid(row=1,column=1) 
  82. # 列表框 
  83. text = Listbox(root,font=('楷体',16),width=50,height=15) 
  84. text.grid(row=2,columnspan=2) 
  85. # 下载按钮 
  86. button1 = Button(root,text='开始下载',font=('楷体',15),command=get_music_name) 
  87. button1.grid(row=3,column=0) 
  88. button2 = Button(root,text='退出程序',font=('楷体',15),command=root.quit) 
  89. button2.grid(row=3,column=1) 
  90. # 显示界面 
  91. root.mainloop() 
  92.  
  93. # 如何将.py代码打包成.exe文件 

 我们再来看看效果吧

这样加上了UI界面和部分代码优化之后,就可以通过 .py代码打包成.exe文件 发布给用户使用了。

 

责任编辑:姜华 来源: 今日头条
相关推荐

2021-03-18 09:18:12

python爬虫

2017-10-26 15:17:06

Python爬虫框架歌曲下载

2021-07-27 09:02:50

Python下载音乐Python基础

2020-10-13 09:53:51

HarmonyOS入门下载

2023-02-07 08:01:57

Python工具桌面

2023-11-07 09:39:10

Python壁纸桌面

2018-01-11 10:20:04

Python爬虫豆瓣音乐

2017-12-20 09:35:25

Python爬虫百度云资源

2009-04-16 09:17:21

2014-12-31 16:52:53

音乐播放器源码

2020-11-06 08:28:44

Python

2014-08-05 15:10:05

Larbin搜索引擎

2009-04-08 09:09:47

2011-09-19 10:56:21

IOS应用Frenzapp Mu音乐

2015-01-19 12:19:04

iOS源码ActionSheet仿QQ音乐

2013-09-05 13:52:17

QQ音乐

2010-06-25 10:50:18

土豆网腾讯

2019-09-26 09:34:51

网络爬虫搜索引擎大数据

2010-08-02 16:08:39

ibmdwJava搜索引擎

2017-08-09 15:27:33

python爬虫开发工具
点赞
收藏

51CTO技术栈公众号