Python自学技巧与资源推荐

 

 

字典在转化为其他类型时,会出现是否舍弃value的操作,只有在转化为字符串的时候才不会舍弃value

注释的快捷键是ctrl+/

字符串无法与整数,浮点数,等用加号完成拼接

5不入???

还有一种格式化的方法

不限制类型,不做精度的控制

type()

判断的条件应是bool类型

仅仅是空格则不行

想要规范一些,就要遵循一些格式

必须在赋值之前声明为全局变量

del仅仅完成删除的操作

像append,extend都是不可以用的,因为元组不可以修改

传入的’12‘会被划分为两个小字符串’1‘’2‘

集合没有下表索引,故.pop不能指定下标来进行取出,而列表可以

集合不支持下标索引

字典不允许Key 的重复

list,tuple,setstring是没有办法去转化成字典的,但字典是可以转换成别的容器的,转换成字符串字典不会丢失value,转换成其他类型,字典会丢失value

容器的通用排序功能

排序的结果会变成列表对象

python函数进阶

(1)函数的多返回值

(3)匿名函数

2.函数的多种传参方式

(1)掌握位置参数
(2)关键字参数
(3)不定长参数
(4)缺省参数

位置参数与其他传参进行混用时,需要写在最前面,不然就会出现语法错误

默认参数必须定义在最后面

位置传递

kw指keyword

匿名函数

1.函数作为参数传递

实际上传入的是代码的执行逻辑

2.lambda匿名函数

默认直接return ,不用写return语句

并且没有办法进行回车换行写多行

python文件操作

了解编码

了解文件的操作

encoding参数在函数定义中并不是第3位,所以要使用关键字传参

f是对文本文件进行操作功能的对象

w:覆盖写入

read()得到的类型是字符串

这里的strip是为了去除换行符

文件的追加操作

应先换行再进行追加

文件操作案例:实现文件的备份操作

Python异常,模块与包

except(),这个括号是元组

所以的异常都是基于这个顶级的异常Exception

当捕获Exception时,所有的异常都可以捕获到

finally和exception都是可选的

异常的传递

故捕获异常时并不需要从真正出现异常的那一行开始捕获

python模块

模块的导入

[ ]表示的都是可选的意思

例:from time import *相较于直接import time的不同在于

前者可以直接使用内部的函数sleep(),而后者需要time.sleep()

“.”是用于确定层级关系的

给导入的功能设置一个别名

自定义模块

模块名要符合标识符的命名规则

这种定义函数的写法应再了解一下

右键run 的时候内置函数__name__就会被标记为__main__,故if语句成立,执行

python文件都存在__name__的这个内置变量

当以from的模块导入运行的时候,模块内部的__name__不会被标记为__main__

上图在主函数只能够使用test_A(),而不能使用test_B(),__all__指向列表

但可以自行导入未包含在__all__内的函数,

但是__all__不会限制你直接导,from my_module import pr1,就可以使用pr1

python包

(1)自定义包

(2)如何安装第三方包

只有__init__.py文件存在于文件夹当中,那么这个文件夹就是python包,否则就是一个普通的文件夹

可以直接深入到对应的模块函数

安装第三方包

json数据格式

什么是json

如何使用json进行数据转化

json如果是列表的话,要求其元素一定是字典

如果为true,中文就会转化为unicode字符了

注:

pyecharts模块介绍

https://05x-docs.pyecharts.org/#/zh-cn/

https://gallery.pyecharts.org/#/README

pyecharts快速入门

构建一个基础的折线图

使用全局配置项设置属性

构建基础的折线图

使用全局配置项设置属性

数据处理

通过json模块对数据进行处理

import json 
f_us = open("D:/美国.txt","r",encoding="UTF-8")
f_us_data = f_us.read()#读取数据成字符串

f_us_data = f_us_data.replace("jsonp_1629344292311_69436(","")#删除开头不需要的部分
f_us_data = f_us_data[:-2]#删除结尾的部分
f_us_dict = json.loads(f_us_data)#转换为字典

trend_data = f_us_dict["data"][0]["trend"]#将范围缩小到“trend”

x_data = trend_data["updateDate"][:314]#拿到日期数据
y_data = trend_data["list"][0]["data"][:314]#拿到“确诊”数据

创建折线图

import json 
from pyecharts.charts import Line
from pyecharts.options import TitleOpts,LabelOpts
f_us = open("D:/美国.txt","r",encoding="UTF-8")
f_jp = open("D:/日本.txt","r",encoding="UTF-8")
f_in = open("D:/印度.txt","r",encoding="UTF-8")

f_us_data = f_us.read()#读取数据成字符串
f_jp_data = f_jp.read()
f_in_data = f_in.read()

f_us_data = f_us_data.replace("jsonp_1629344292311_69436(","")#删除开头不需要的部分
f_jp_data = f_jp_data.replace("jsonp_1629350871167_29498(","")
f_in_data = f_in_data.replace("jsonp_1629350745930_63180(","")

f_us_data = f_us_data[:-2]#删除结尾的部分
f_jp_data = f_jp_data[:-2]
f_in_data = f_in_data[:-2]

f_us_dict = json.loads(f_us_data)#转换为字典
f_jp_dict = json.loads(f_jp_data)
f_in_dict = json.loads(f_in_data)

us_trend_data = f_us_dict["data"][0]["trend"]#将范围缩小到“trend”key
jp_trend_data = f_jp_dict["data"][0]["trend"]
in_trend_data = f_in_dict["data"][0]["trend"]

us_x_data = us_trend_data["updateDate"][:314]#拿到日期数据,并取到2020年的12月31号
jp_x_data = jp_trend_data["updateDate"][:314]
in_x_data = in_trend_data["updateDate"][:314]

us_y_data = us_trend_data["list"][0]["data"][:314]#拿到“确诊”数据
jp_y_data = jp_trend_data["list"][0]["data"][:314]
in_y_data = in_trend_data["list"][0]["data"][:314]

line = Line()

line.add_xaxis(us_x_data)

line.add_yaxis("美国确诊人数",us_y_data,label_opts=LabelOpts(is_show=False))
line.add_yaxis("日本确诊人数",jp_y_data,label_opts=LabelOpts(is_show=False))
line.add_yaxis("印度确诊人数",in_y_data,label_opts=LabelOpts(is_show=False))
line.set_global_opts(
    title_opts=TitleOpts(title="2020年美印日三国的确诊人数对比折线图",pos_left="center",pos_bottom="1%")#设置标题居中朝下
)

line.render()#生成图表

f_us.close()
f_in.close()
f_jp.close()

地图可视化

基础地图使用

from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts
map = Map()
data = [
    ('北京市', 99),
    ('上海市', 199),
    ('重庆市', 200),
    ('四川省', 399),
    ('广东省', 499)
]

map.add("地图",data,"china")#添加数据

#设置全局选项
map.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {"min":1,"max":9,"label":"1-9","color":"#CCFFFF"},
            {"min":10,"max":99,"label":"10-99","color":"#FF6666"},
            {"min":100,"max":500,"label":"100-500","color":"#990033"}
        ]
    )

)
map.render()#生成地图数据

疫情地图-国内疫情地图

import json
from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts
map = Map()
f = open("D:/疫情.txt","r",encoding="UTF-8")
data_str = f.read()#读取全部数据
f.close()
data_dict = json.loads(data_str)#将json转化为字典
province_list = data_dict["areaTree"][0]["children"]#将每个省的数据都封装入列表中
data_list = []#设定数据列表
for province_data in province_list:
    province_name = province_data["name"]#省份名称
    province_confrm = province_data["total"]["confirm"]#每个省份的确诊人数
    data_list.append((province_name,province_confrm))#将数据压入到数据列表中
print(data_list)

map.add("地图",data_list,"china")#添加数据

#设置全局选项
#注意现在的pyechats显示地图数据需要写省份的全名,不然不会显示数据,这里由于省份数量过多,就不进行添加了
map.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {"min":1,"max":9,"label":"1-9","color":"#CCFFFF"},
            {"min":100,"max":999,"label":"100-999","color":"#FFFF99"},
            {"min":1000,"max":4999,"label":"1000-4999","color":"#FF9966"},
            {"min":5000,"max":9999,"label":"5000-9999","color":"#FF6666"},
            {"min":10000,"max":99999,"label":"10000-99999","color":"#CC3333"},
            {"min":100000,"label":"100000+","color":"#990033"}
        ]
    )
)
map.render("全国疫情地图数据.html")#生成地图数据

疫情地图-省级疫情地图

import json
from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts,TitleOpts
f = open("D:/疫情.txt","r",encoding = "UTF-8")
data = f.read()
data_dict = json.loads(data)
henan_data = data_dict["areaTree"][0]["children"][3]["children"]
area_list = []
area_list.append(("济源市",5))
for area_data in henan_data:
    area_name = area_data["name"]+"市"
    area_confirm = area_data["total"]["confirm"]    
    area_list.append((area_name,area_confirm))
map = Map()
map.add("河南",area_list,"河南")
map.set_global_opts(
    title_opts=TitleOpts(title="河南省疫情地图",pos_bottom="1%",pos_left="center"),
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {"min":1,"max":99,"label":"1-99","color":"#CCFFFF"},
            {"min":100,"max":999,"label":"100-999","color":"#FFFF99"},
            {"min":1000,"max":4999,"label":"1000-4999","color":"#FF9966"},
            {"min":5000,"max":9999,"label":"5000-9999","color":"#FF6666"},
            {"min":10000,"max":99999,"label":"10000-99999","color":"#CC3333"},
            {"min":100000,"label":"100000+","color":"#990033"}
        ]
    )
)
map.render("河南省疫情分布图.html")

动态柱状图

基础柱状图

from pyecharts.charts import Bar
from pyecharts.options import LabelOpts
bar = Bar()
bar.add_xaxis(["Akebi","Komichi","Hobert"])
bar.add_yaxis("age",[15,15,19],label_opts=LabelOpts(position = "right"))#将Y轴的数据标签显示在最右侧
bar.reversal_axis()#反转XY轴,从左往右显示
bar.render()

基础时间线柱状图

基础时间线配置动态图表

主题更改颜色样式

from pyecharts.charts import Bar,Timeline
from pyecharts.options import LabelOpts
from pyecharts.globals import ThemeType
bar1 = Bar()
bar1.add_xaxis(["Akebi","Komichi","Hobert"])
bar1.add_yaxis("age",[15,15,19],label_opts=LabelOpts(position = "right"))#将Y轴的数据标签显示在最右侧
bar1.reversal_axis()#反转XY轴,从左往右显示

bar2 = Bar()
bar2.add_xaxis(["Akebi","Komichi","Hobert"])
bar2.add_yaxis("age",[20,20,25],label_opts=LabelOpts(position = "right"))#将Y轴的数据标签显示在最右侧
bar2.reversal_axis()#反转XY轴,从左往右显示

bar3 = Bar()
bar3.add_xaxis(["Akebi","Komichi","Hobert"])
bar3.add_yaxis("age",[23,23,28],label_opts=LabelOpts(position = "right"))#将Y轴的数据标签显示在最右侧
bar3.reversal_axis()#反转XY轴,从左往右显示

timeline = Timeline({"theme":ThemeType.LIGHT})#设置主题颜色

timeline.add(bar1,"点1")
timeline.add(bar2,"点2")
timeline.add(bar3,"点3")

#自动播放设置
timeline.add_schema(
    play_interval=1000,         #自动播放的时间间隔
    is_timeline_show=True,      #是否显示时间线
    is_auto_play = True,         #是否自动播放
    is_loop_play=True          #循环
)



timeline.render()#改用时间线进行绘图

GDP动态柱状图


"""
定义lambda函数的形式
"""
list1 = [["Akebi",15],["Komichi",13],["Hobert",19]]
list1.sort(key = lambda x:x[1],reverse=False)#设置排序的依据为导入的列表元素的下标为1的元素
print(list1)


"""
普通定义函数的形式
"""
list1 = [["Akebi",15],["Komichi",13],["Hobert",19]]
def fuc(x):
    return x[1]#将下标1返回按照数字进行排序
list1.sort(key = fuc,reverse=False)#函数传参,只需传入函数名即可
print(list1)

导入csv格式的数据

ANSI表示WINDOWS模式下的默认编码格式,即表示跟随操作系统的语言版本变化的

win11是中文,那么默认的中文编码就是GB2312

字典中的key如果不存在,对其调用就会报错

from pyecharts.charts import Bar,Timeline
from pyecharts.options import *
from pyecharts.globals import *
f = open("D:/1960-2019全球GDP数据.csv","r",encoding = "GB2312")
data_lines = f.readlines()
data_lines.pop(0)#要注意使用pop方法的格式
data_dict = {}

for line in data_lines:
    year = int(line.split(",")[0])#要将年份转换为整型
    country = line.split(",")[1]
    GDP = float(line.split(",")[2])#可以将科学计数法的数用float进行转换
    try:
        data_dict[year].append([country,GDP])
    except Exception:#由于字典中如果没有对应的key,却进行了调用,程序会报错,利用捕获,就可以判断是否有key,并进行赋值操作
        data_dict[year] = []
        data_dict[year].append([country,GDP])
sort_year_list = sorted(data_dict.keys())
timeline = Timeline({"theme":ThemeType.LIGHT})

for year in sort_year_list:
    data_dict[year].sort(key=lambda x:x[1],reverse = True)
    x_data = []
    y_data = []
    for country_gdp in data_dict[year][0:8]:
        x_data.append(country_gdp[0])
        y_data.append(country_gdp[1]/100000000)#单位为亿
    x_data.reverse()
    y_data.reverse()
    bar = Bar()
    bar.add_xaxis(x_data)
    bar.add_yaxis("GDP(亿)",y_data,label_opts=LabelOpts(position="right"))
    bar.reversal_axis()
    bar.set_global_opts(#设置标题
        title_opts=TitleOpts(title=f"{year}年世界前8GDP数据")
    )
    timeline.add(bar,str(year))

#设置自动播放
timeline.add_schema(
    play_interval=1000,
    is_auto_play=True,
    is_loop_play=True,
    is_timeline_show=True
     
)
timeline.render()

    




初识对象

成员方法

函数是写在类的外面的

而方法是定义在类的里面的函数

类和对象

面向对象,简单来说,就是让对象按命令去干活

构造方法

其他内置方法(魔术方法)

将类对象变成字符串

在def __str_的“return”可以修改输出字符串的类型

">"和"<",不能直接比较两个类对象

other 表示的是另一个用于比较的对象

lt不支持小于等于和大于等于

"=="该符号默认比较内存地址

而"__eq__"则可以实现成员变量间的比较

封装

将现实世界的事物封装到了程序的内部

私有成员可以通过运行其他成员而执行

私有成员和方法是没有办法被类对象直接使用的

但在创建类的时候,却可以进行使用

继承

继承的基础语法

pass关键字用于补全语法,保证定义的完整性

在子类调用父类的成员

复写和使用父类成员

self相当于C++中的this指针

super其实是指父类的意思

运用场景:

父类拥有部分功能,子类在父类的基础上拓展了相应的功能,但要沿用父类的一些功能可以直接调用父类成员,不用重写

类型注解

变量的类型注解,函数(方法)和返回值的类型注解

函数(方法)的类型注解

形参注解

返回值注解

 

alt+回车=导入函数包

json.loads可以将字符串格式转变为字典格式

注解写错并不会产生运行的问题

Union类型

需要先进行导包

多态

同一种行为,不同的运行状态

 以标准来约束某些行为

抽象类用于顶层设计 ,以便子类做具体的实现。

也是对子类的一种软性约束,要求子类必须复写(实现)父类的一些方法

有了标准后,真正工作的是其子类

这里在定义好类后,一定要记得创建子类的对象,然后用子类创建的对象进行传参

定义函数的类型注解的是父类对象,实际上传入的是子类对象(由于子类将父类的方法进行了复写)

综合案例

在本案例的实现过程中,我犯了很多经典错误,导致浪费了大量的时间

我用python的内置类型名list作为变量名,导致出错,自定义类无法正常调用

源码文件

data_save.py

class Record:
    def __init__(self,time,date,name):
        self.time = time
        self.date = date
        self.name = name
    def __str__(self):
        return f"{self.time},{self.date},{self.name}"
    # def __call__(self, *args, **kwargs):
    #     return f"{self.time},{self.date},{self.name}"
    
#利用__str__将print(record)的数据转换为自定义类型

 file_def.py

from date_save import Record
import json 
class AC :#定义抽象类,实现顶层设计
    def readFile(self):#读取文件数据,读到的每一条数据都转换为Record对象,将他们都封装到list返回即可
        pass
class File1(AC):
    def __init__(self,path):    #定义成员变量记录文件的路径
        self.path = path
    def readFile(self):
        f1 = open(self.path,"r",encoding="UTF-8")
        
        record_list = []
        for i in f1.readlines():  #括号里不需要加内容
            i = i.strip()#消除每一行读取到的\n
            i_list = i.split(",")
            record = Record(i_list[0],int(i_list[1]),i_list[2])
            record_list.append(record)
        f1.close
        return record_list
class File2(AC):
    def __init__(self,path):
        self.path = path
    def readFile(self):
        f1 = open(self.path,"r",encoding="UTF-8")
        record_list = []
        for i in f1.readlines():
            data_dict = json.loads(i)#读取一行就转换一行
            record = Record(data_dict["time"],int(data_dict["data"]),data_dict["name"])
            record_list.append(record) 
        f1.close()
        return record_list
if __name__ == '__main__':
    file1 = File1("D:/Akebi.txt")
    file2 = File2("D:/Komichi.txt")
    list1 = file1.readFile()
    list2 = file2.readFile()#json的数据格式一定检查,str在json数据中一定要用" ",可以写成字典的形式
    for l in list1:
        print(l)
    for l in list2:
        print(l)
    # print(list1)
    # print(list2)

main.py

from file_def import File1,File2
from date_save import Record
from pyecharts.charts import Bar
from pyecharts.options import *
from pyecharts.globals import ThemeType
file1 = File1("D:/Akebi.txt")
file2 = File2("D:/Komichi.txt")
list1 = file1.readFile()
list2 = file2.readFile()
all_list: list[Record] = list1+list2
data_dict = {}
for record in all_list:
    if record.time in data_dict.keys():
        data_dict[record.time] +=record.date
    else:
        data_dict[record.time] = record.date
# print(list(data_dict.keys()))
# dict = {"Akebi":14,"Komichi":13}
# print(data_dict.keys())
# print(data_dict.values())
print(data_dict)
print(data_dict.keys())
print(list(data_dict.keys()))
bar = Bar()
bar.add_xaxis(list(data_dict.keys()))
bar.add_yaxis("爆金币",list(data_dict.values()),label_opts=LabelOpts(is_show=False))
bar.render("爆金币的柱状图.html")

SQL

数据库介绍

MySQL安装

MySQL的使用

show databases ;

8.0.36版本的要在分号前加个空格 

前三个数据库是供MySQL内部使用的,dbeaver为防止误操作,将前三个库进行了隐藏

SQL基础与DDL

 DML插入,删除,更新的语法

[ ]表示的意思是可选,即可写可不写

DQL 

基础查询

*一般代表通配符的意思

分组聚合

 

前面字段(非聚合函数)写了其他的列会报错 

count(*):按性别来分,有几行就数几行

排序分页 

ASC表示升序,默认的升序可以不写 

limit 10,5 :表示跳过前面的十条直接从第十一条开始,往后取5条

python操作数据库 

基础使用

非查询性质的SQL语句 

 

执行查询性质的SQL语句 

 

数据插入

 综合案例 

main.py

from pymysql import Connection
from file_def import File1,File2
from date_save import Record
from pyecharts.charts import Bar
from pyecharts.options import *
from pyecharts.globals import ThemeType
file1 = File1("D:/Akebi.txt")
file2 = File2("D:/Komichi.txt")
list1 = file1.readFile()
list2 = file2.readFile()
all_list: list[Record] = list1+list2
conn = Connection(
    host = "localhost",
    port = 3306,
    user = "root",
    password = "5549186862XHBabc",
    autocommit = True
)
cursor = conn.cursor()#获取游标对象
conn.select_db("Komichi")#选择数据库
for record in all_list:#组织sql语句
    sql = f"insert into orders(my_time,my_data,name) values ('{record.time}',{record.date},'{record.name}')"
    cursor.execute(sql)#执行sql语句
conn.close()

data_save.py

file_def.py

(这两个代码文件可以到上一个综合案例来看)

Py_spark实战

 

 

 

 

链式调用的原则是不管调用什么方法,返回值得到的都是同一个对象

物联沃分享整理
物联沃-IOTWORD物联网 » Python自学技巧与资源推荐

发表评论