不超过百行的SQL文件提取器

数据库
数据的获取以及对数据的处理非常重要。

数据是互联网的灵魂、没有数据互联网就是一个无用的空壳子,像人工智能、大数据、智能算法等。都是需要基础数据来验证模型是否是可用的,来进行调参矫正算法的可用性、帮助算法的落地,对算法起到最关键的作用。所以数据的获取以及对数据的处理就是非常重要的。

通常的数据格式是txt、sql、excel以及word,其中最重要的还是SQL中的数据、SQL数据包括MySQL、SQLServer、SQLite、Oracle等,导出的数据格式。 常用的数据处理语言是Python、因为Python是个胶水语言,没有Python搞不定的事。 Python比较适合做些快速、时间紧、参与人员较少,切性能要求不高的项目,而且Python成熟的库很多、这也是它 被称为 胶水语言的原因 。

技术要求需要懂得python3的基础语法以及对正则表达式有基础了解。

实现步骤

1.读取SQL文件中的数据、去除多余的内容并提取需要的数据、追加到集合中;

# -*- coding: utf-8 -*-
# !/usr/bin/python3
# desc by: 两行代码实现SQL文件中数据提取,后期可以结合geogle浏览器插件应用
# author by : rainNight
# weChatPublicNumber: 雨夜的博客
import re
import json
"""

第一步:读取area.sql文件,去除多余内容提取需要添加的数据
第二步:定义转换后的文件地址,写入文件
"""

opens = open("./data/area.sql", encoding="utf-8")
codeline = opens.readlines() # 一行一行的读取
jsonList = []
for line in codeline:
if re.match("INSERT", line):
jsonList.append(re.findall(re.compile(r'[(](.*?)[)]', re.S), line))

2.将集合中的数据转成json格式;

3.定义转换后的文件地址并写入文件中

jsonArray = json.dumps(jsonList)
jsonOpen = open("./data/areaToJson.txt", "w")
jsonOpen.writelines(str(jsonArray))
opens.close()
jsonOpen.close()

所有代码:

# -*- coding: utf-8 -*-
# !/usr/bin/python3
# desc by: 两行代码实现SQL文件中数据提取,后期可以结合geogle浏览器插件应用
# author by : rainNight
# weChatPublicNumber: 雨夜的博客
import re
import json

"""
第一步:读取area.sql文件,去除多余内容提取需要添加的数据
第二步:定义转换后的文件地址,写入文件
"""

opens = open("./data/area.sql", encoding="utf-8")
codeline = opens.readlines() # 一行一行的读取
jsonList = []
for line in codeline:
if re.match("INSERT", line):
jsonList.append(re.findall(re.compile(r'[(](.*?)[)]', re.S), line))

jsonArray = json.dumps(jsonList)
jsonOpen = open("./data/areaToJson.txt", "w")
jsonOpen.writelines(str(jsonArray))
opens.close()
jsonOpen.close()

实现的结果:

细微思路的发现、并将该思维实现产品中逐渐放大化,最终实现体系走向产品运营。

责任编辑:张燕妮 来源: 雨夜的博客
相关推荐

2021-06-07 23:23:44

函数代码结构化

2012-03-28 14:33:41

人人布丁应用排名

2022-08-10 19:28:40

Hadoop数据库

2011-02-19 11:12:35

2021-05-28 17:02:07

阿里云低代码钉钉

2011-06-03 17:43:34

SEO

2009-11-01 18:48:36

360杀毒日下载量超过百万

2010-04-14 09:33:48

2010-09-02 15:47:17

李彦宏

2019-08-30 12:53:20

互联网数据技术

2022-06-29 09:02:31

go脚本解释器

2020-12-09 14:40:30

Linux基金会项目程序开发

2015-09-11 13:10:17

中科曙光数据中国

2022-06-28 08:17:10

JSON性能反射

2014-01-07 15:38:28

信息

2024-10-16 21:17:59

2019-08-19 01:02:47

2024-04-07 06:50:00

2017-07-21 13:21:09

互联网

2021-12-17 12:12:22

Python 开发数据
点赞
收藏

51CTO技术栈公众号