Python--序列化与反序列化

佚名 6年前 (2020-06-10) Python 2718人围观抢沙发百度已收录

序列化是将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间，对象将其当前状态（存在内存中）写入到临时或持久性存储区（硬盘）。以后，可以通过从存储区中读取或反序列化对象的状态，重新创建该对象。

实现对象的序列化和反序列化在python中有两种方式：json 和 pickle。

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

其中json用于字符串和 python数据类型间进行转换，pickle用于python特有的类型和 python的数据类型间进行转换，pickle是python特有的。

1、JSON序列化：json.dumps()

 1 info = {
 2     "name":"tj",
 3     "age":22
 4 }
 5 import  json
 6 print(info)
 7 print(type(info))
 8 print(json.dumps(info))
 9 print(type(json.dumps(info)))
10 
11 f = open("test.txt","w")
12 # f.write(info)   # TypeError: write() argument must be str, not dict
13 f.write(json.dumps(info)) # 正常写入文件 f.write(json.dumps(info)) 等价于 json.dump(info, f)
14 f.close()
15 
16 >>>
17 {'name': 'tj', 'age': 22}
18 <class 'dict'>
19 {"name": "tj", "age": 22}
20 <class 'str'>

2、JSON反序列化：json.loads()

1 f = open("test.txt","r")
2 # print(f.read()["age"])  #TypeError: string indices must be integers
3 data = json.loads(f.read())  # data = json.loads(f.read()) 等价于 data = json.load(f)
4 print(data["age"])
5 f.close()
6 
7 >>>
8 22

注意：对于以下这种情况json就不能处理了

 1 import  json
 2 def hello(name):
 3     print("hello,",name)
 4 info = {
 5     "name":"tj",
 6     "age":22,
 7     "func":hello
 8 }
 9 f = open("test2.txt","w")
10 f.write(json.dumps(info)) #TypeError: Object of type function is not JSON serializable
11 f.close()

所以：json用于字符串和 python数据类型间进行转换

3、pickle序列化：pickle.dumps()

 1 import  pickle
 2 def hello(name):
 3     print("hello,",name)
 4 info = {
 5     "name":"tj",
 6     "age":22,
 7     "func":hello
 8 }
 9 
10 print(pickle.dumps(info)) #可见pickle序列化的结果输出为二进制，所以应使用wb的方式往文件中写
11 f = open("test2.txt","wb")
12 f.write(pickle.dumps(info)) # 等价于 pickle.dump(info,f)
13 f.close()
14 
15 >>>
16 b'\x80\x04\x957\x00\x00\x00\x00\x00\x00\x00}\x94(\x8c\x04name\x94\x8c\x04alex\x94\x8c\x03age\x94K\x16\x8c\x04func\x94\x8c\x08__main__\x94\x8c\x05hello\x94\x93\x94u.'

对于函数hello，序列化的不是内存地址，而是整个数据对象，函数可以序列化。

4、pickle反序列化：pickle.loads()

f = open("test2.txt","rb")
data = pickle.loads(f.read()) # 等价于data = pickle.load(f)
print(data)
print(data["name"])
print(data["func"])

>>>
{'name': 'tj', 'age': 22, 'func': <function hello at 0x00000179EF69C040>}
tj
<function hello at 0x00000179EF69C040>

5、多次序列化与反序列化

1）json

import json
info = {
    "name":"tj",
    "age":22
}

f = open("test3.txt","w")
f.write(json.dumps(info))
info['age'] = 21
f.write(json.dumps(info))
f.close()
# 
>>>
序列化两次后test3中的内容
test3.txt: {"name": "tj", "age": 22}{"name": "tj", "age": 21}

f = open("test3.txt","r")
# 报错，py3以上，多次dumps的文件反序列化报错，py2多次dumps的文件也能被反序列化，先序列化的先被反序列化
data = json.loads(f.read()) # json.decoder.JSONDecodeError
f.close()
print(data)

2）pickle

import  pickle

info = {
    "name":"tj",
    "age":22
}

f = open("test2.txt","wb")
f.write(pickle.dumps(info)) # 等价于 pickle.dump(info,f)
info["sex"] = "女"
f.write(pickle.dumps(info)) # 等价于 pickle.dump(info,f)
f.close()

>>>
序列化两次后test2.txt中的内容
test2.txt： ��       }�(�name攲tj攲age擪u.��%       }�(�name攲tj攲age擪�sex攲濂硵u.

f = open("test2.txt","rb")
data = pickle.loads(f.read()) # 第一次反序列化正常
# data = pickle.loads(f.read()) # 第二次反序列化：EOFError: Ran out of input
print(data)
print(data["age"])
# print(data["sex"])  # KeyError: 'sex'