内容介绍

数据类型
字符编码
文件处理

1.什么是数据？

x=10 , 10是我们要存储的数据。

2.为何数据要分不同的类型

数据是用来表示状态的，不同的状态就应该用不同的类型的数据去表示

3.数据类型

数字（整形，长整形，浮点型，复数）
字符串
字节串：在介绍字符编码时介绍字节bytes类型
列表
元组
字典
集合

4.按照以下几个点展开数据类型的学习

#一：基本使用1 用途2 定义方式3 常用操作+内置的方法#二：该类型总结1 存一个值or存多个值    只能存一个值    可以存多个值，值都可以是什么类型2 有序or无序3 可变or不可变    ！！！可变：值变，id不变。可变==不可hash    ！！！不可变：值变，id就变。不可变==可hash

数字

整型与浮点型

#整型int    作用：年纪，等级，身份证号，qq号等整型数字相关    定义：        age=10  #本质age=int(10)#浮点型float    作用：薪资，身高，体重，体质参数等浮点数相关    salary=3000.3 #本质salary=float(3000.3)#二进制，十进制，八进制，十刘进制

其他数字类型（了解）

“`py

长整形（了解# ）

在python2中（python3中没有长整形的概念）：>>> num=2L>>> tpye(num)<type 'long'>

复数（了解）

>>> x=1-2j>>> x.real1.0>>> x.imag-2.0

字符串

#作用： 名字，性别，国籍，地址等描述信息#定义： 在单引号、双引号、三引号内，由一串字符组成name='egon'#优先掌握的操作：按索引取值（正向取+反向取）：只能取切片（顾头不顾尾，步长）长度len成员运算in和not in移除空白strip切分split循环

基他操作（包括常用）

#stripname='*egon**'print(name.strip('*'))print(name.lstrip('*'))print(name.rstrip('*'))#startswith,endswithname='alex_SB'print(name.endswith('SB'))            #判断字给定字符串是否在结尾，如果在则返回True,不在则为Falseprint(name.startswith('alex'))           #判断给定字符串是否在开头，如果在则返回True,不在则为False#replacename='alex say :i have one tesla,my name is alex'print(name.replace('alex','SB',1))                #替换，把alex替换为SB，1表示只替换匹配到的第一个字符串#format的三种玩法res='{} {} {}'.format('egon',18,'male')        #format,自定义格式，注意中间的空格。把format后面的字符串放入大括号中。res='{1} {0} {1}'.format('egon',18,'male')    #按照输入的位置，按0，1，2，3指定位置排列。res='{name} {age} {sex}'.format(sex='male',name='egon',age=18)        #设置变量，指定变量的位置，format后面的输入顺序就不重要了。#find,rfind,index,rindex,countname='egon say hello'print(name.find('0',1,3))  #查找0，顾头不顾尾，找不到则返回-1不会报错，找到了则显示索引# print(name.index('e',2,4)) #同上，但是找不到会报错print(name.count('e',1,3))  #顾头不顾尾，如果不指定范围则查找所有#splitname='root:x:0:0::/root:/bin/bash'print(name.split(':')) #指定冒号为默认分隔符 为空格name='C:/a/b/c/d.txt' #只想拿到顶级目录print(name.split('/',1))name='a|b|c'print(name.rsplit('|',1))   #从右开始切分#jointag=' 'print(tag.join(['egon','say','hello','world']))  #可迭代对必须都是字符串,把tag加入到对应的字符串中。#center,ljust,rjust,zfillname='egon'print(name.center(30,'-'))        #30为总字符串，让name在30个字符中居中，不够的用-填充。print(name.ljust(30,'*'))            #30为总字符串，让name在30个字符中排最左，不够用*填充print(name.rjust(30,'*'))            #30为总字符串，让name在30个字符中排最右，不够用*填充。print(name.zfill(50))   #用0填充50个字符,name在最右。#expandtabsname='egon\thello'        #\t制表符print(name)print(name.expandtabs(1))        #1为指定多少个字隔做为分隔符号。#lower,uppername='egon'print(name.lower())            #全替换为小写print(name.upper())            #全替换为大写#captalize,swapcase,titleprint(name.capitalize())    #首字母大写print(name.swapcase())      #大小写翻转msg='egon say hi'print(msg.title())      #每个单词的首字母大写#is数字系列#在python中num1=b'4'   #bytesnum2=u'4'   #unicode,python3中无需加u就是unicodenum3='四'    #中文数字num4='IV'   #罗马数字#isdigt:bytes,unicodeprint(num1.isdigit())   #Trueprint(num2.isdigit())   #Trueprint(num3.isdigit())   #Falseprint(num4.isdigit())   #False#isnumberic:unicode中文数字，罗马数字#bytes类型无isnumberic方法print(num2.isnumeric()) #Trueprint(num3.isnumeric()) #Trueprint(num4.isnumeric()) #True#三者不能判断浮点数num5='4.3'print(num5.isdigit())print(num5.isdigit())print(num5.isdigit())'''总结：    最常用的isdigit,可以判断bytes和unicode类型，这也是最常见的数字应用场景    如果要判断中文数字或罗马数字，则需要用到isnumeric'''#is其他print('===>')name='egon123'print(name.isalnum())   #判断字符串是否由字母或数字组成print(name.isalpha())   #判断字符串是否只由字母组成print(name.isidentifier())print(name.islower())print(name.isupper())print(name.isspace())print(name.istitle())

练习

# 写代码，有如下变量，请按照要求实现每个功能name = " aleX"# 1)    移除name 变量对应的值两边的空格，并输出处理结果# 2）    判断name变量对应的值是否以"al"开头，并输出结果# 3）    判断name变量对应的值是否以"X"结尾，并输出结果# 4）    将 name变量对应的值中的"1"替换为"p"，并输出结果# 5）    将 name 变量对应的值根据 “l” 分割,并输出结果。# 6)    将 name 变量对应的值变大写,并输出结果 # 7)    将 name 变量对应的值变小写,并输出结果 # 8)    请输出 name 变量对应的值的第 2 个字符?# 9)    请输出 name 变量对应的值的前 3 个字符?# 10)    请输出 name 变量对应的值的后 2 个字符? # 11)    请输出 name 变量对应的值中 “e” 所在索引位置? # 12)    获取子序列,去掉最后一个字符。如: oldboy 则获取 oldbo。

# 写代码，有如下变量，请按照要求实现每个功能name = 'alex'#1) 移除name变量对应的值两边的空格，并输出处理结果name = 'alex'a=name.strip()print(a)# 2) 判断name 变量对应的值是否以"al"开头，并输出结果name='alex'if name.startswith(name):    print(name)else:    print('no')# 3）    将name变量对应的值是否以"x"结尾，并输出结果name='alex'if name.endswith(name):    print(name)else    print('no')# 4) 将name变量对应的值中的"1"替换为"p",并输出结果name='alex'print(name.replace('1','p'))# 5) 将name 变量对应的值根据"1"分割，并输出结果。name='alex'print(name.split('1'))# 6)  将name变量对应的值变大写，并输出结果name='alex'print(name.upper())# 7)  将name变量对应的值变小写，并输出结果name='alex'print(name.lower())# 8) 请输出name变量对应的值的第2个字符？name='alex'print(name[1])# 9) 请输出name变量对应的值的前3个字符name='alex'print(name[:3])# 10） 输出name变量对应的值的后2个字符name='alex'print(name[-2:1])# 11)  请输出name变量对应的值中"e"所在索引位置name='alex'print(name.index('e'))# 12)  获取子序列，去掉最后一字符。如：oldboy 则获取oldboname='alex'a=name[:-1]print(a)

四、列表

#作用： 多个装备，多个爱好，多门课程，多个女朋友等#定义： []内可以有多个任意类型的值，逗号分隔my_girl_friends=['alex','wupeiqi','yuanhao',4,5] #本质my_girl_friends=list([...])或l=list('abc')#优先掌握的操作按索引存取值（正向存取+反向存取）：即可存也可以取切片（顾头不顾尾，步长）长度成员运算in和not in追加删除循环

#ps:反向步长l=[1,2,3,4,5,6]#正向步长l[0:3:1]  #[1,2,3]#反向步长l[2::-1] #[3,2,1]#列表翻转l[::-1]  #[6,5,4,3,2,1]

练习：

1. 有列表data=['alex',49,[1900,3,18]],分别取出列表中的名字，年龄，出生的年，月，日赋值给不同的变量2.用列表模拟队列3.用列表模拟堆栈4.有如下列表，请按照年龄排序（涉及到匿名函数）l=[    {'name':'alex','age':84},    {'name':'oldboy','age':73},    {'name':'egon','age':18},]答案：l.sort(key=lambda item:item['age'])print(1)

五、元组

#作用：存多个值，对比列表来说，元组不可变（是可以当做字典的key的），主要是用来读#定义：与列表类型比，只不过[]换成（）age=(11,22,33,44,55)本质age=tuple((11,22,33,44,55))#优先掌握的操作：按索引取值（正向取+反向取）：只能取切片（顾头不顾尾，步长）长度成员运算in 和not in循环

练习

#简单购物车，要求如下：实现打印商品详细信息，用户输入商品名和购买数，则将商品名，价格，购买个数加入购物列表，如果输入为空或其他非法输入则要求用户重新输入msg_dic={    'apple':10,    'tesla':100000,    'mac':3000,    'lenovo':30000,    'chicken':10,}

msg_dic={    'apple':10,    'tesla':100000,    'mac':3000,    'lenovo':30000,    'chicken':10,}goods_l=[]while True:    for key,item in msg_dic.items():        print('name:{name} price:{price}'.format(price=item,name=key))    choice=input('商品>>: ').strip()    if not choice or choice not in msg_dic:continue    count=input('购买个数>>: ').strip()    if not count.isdigit():continue    goods_l.append((choice,msg_dic[choice],count))    print(goods_l)

字典

#作用： 存多个值，key-value存取，取值速度快#定义：key必须是不可变类型，value可以是任意类型info={'name':'egon','age':18,sex='male'}  #本质info=dict({....})或info=dict(name='egon',age=18,sex='male')或info=dict([['name','egon'],('age',18)])或{}.fromkeys(('name','age','sex'),None)#优先掌握的操作：按key存取值：可存可取长度len成员运算in和not in删除键keys(),值values(),键值对items()循环

练习

1.有如下值集合[11,22,33,44,55,66,77,88,99,90...],将所有大于66的值保存至字典的第一个key中，将小于66的值保存至第二个key的值中即：  {'k1': 大于66的所有值，'k2': 小于66的所有值}

a={'k1':[],'k2':[]}c=[11,22,33,44,55,66,77,88,99,90]for i in c:    if i>66:        a['k1'].append(i)    else:        a['k2'].append(i)print(a)

2.统计s='hello alex alex say hello sb sb'中每个单词的个数结果如：{'hello':2,'alex':2,'say':1,'sb':2}

s='hello alex alex say hello sb sb'l=s.split()dic={}for item in l;    if item in dic:        dic[item]+=1    else        dic[item]=1print(dic)#其它做法s='hello alex alex say hello sb sb'dic={}words=s.split()print(words)for word in words: #word='alex'    dic[word]=s.count(word)    print(dic)#利用setdefault解决重复赋值'''setdefault的功能1： key存在，则不赋值，key不存在则设置默认值2： key存在，返回的是key对应的已有的值，key不存在，返回的则是要设置的默认值d={}print(d.setdefault('a',1))  #返回1d={'a':2222}print(d.setdefault('a',1))  #返回2222'''s='hello alex alex say hello sb sb'dic={}words=s.split()for word in words: #word='alex'    dic.setdefault(word,s.count(word))    print(dic)#利用集合，去掉重复，减少循环次数s='hello alex alex say hello sb sb'dic={}words=s.split()words_set=set(words)for word in words_set:    dic[word]=s.count(word)    print(dic)

集合

#作用：去重，关系运算，#定义：        知识点回顾        可变类型是不可hash类型        不可变类型是可hash类型#定义集合：        集合：可以包含多个元素，用逗号分割，        集合的元素遵循三个原则：         1：每个元素必须是不可变类型（可hash,可作为字典的key）         2:没有重复的元素         3：无序注意集合的目的是将不同的值存放到一起，不同的集合间用来做关系运算，无需纠结于集合中单个值#优先掌握的操作：长度len成员运算in和not in|合集&交集-差集^对称差集==>, >= ,< ,<= 父集，子集

    二.去重    1.有列表l=['a','b',l,'a','a'],列表元素均可hash类型，去重，得到新列表，且新列表无需保持列表原来的顺序    2.在上题的基础上，保存列表原来的顺序    3.去除文件中重复的行，肯定要保持文件内容的顺序不变    4.有如下列表，列表元素为不可hash类型，去重，得到新列表，且新列表一定要保持列表一定要保持列表原来的顺序l=[    {'name':'egon','age':18,'sex':'male'},    {'name':'alex','age':73,'sex':'male'},    {'name':'egon','age':20,'sex':'female'},    {'name':'egon','age':18,'sex':'male'},    {'name':'egon','age':18,'sex':'male'},]

#去重，无需保持原来的顺序l=['a','b',l,'a','a']print(set(1))#去重，并保持原来的顺序#方法一：不用集合l=[l,'a','b',1,'a']l1=[]for i in l:    if i not in l1:        l1.append(i)print(l1)#方法二：借助集合l1=[]s=set()for i in l:    if i not in s:        s.add(i)        l1.append(i)print(l1)#同上方法二，去除文件中重复的行import oswith open('db.txt','r',encoding='utf-8') as read_f,\        open('.db.txt.swap','w',encoding='utf-8') as write_f:    s=set()    for line in read_f:        if line not in s:            s.add(line)            write_f.write(line)os.remove('db.txt')os.rename('.db.txt.swap','db.txt')#列表中元素为可变类型时，去重，并且保持原来顺序l=[    {'name':'egon','ag':18,'sex':'male'},    {'name':'alex','age':73,'sex':'female'},    {'name':'egon','age':20,'sex':'female'},    {'name':'egon','age':18,'sex':'male'},    {'name':'egon','age':18,'sex':'male'},]# print(set(1))  #报错：unhashable type: 'dict's=set()l1=[]for item in l:    val=(item['name'],item['age'],item['sex'])    if val not in s:        s.add(val)        l1.append(item)print(l1)#定义函数，既可以针对可以hash类型又可以针对不可hash类型def func(items,key=None):    s=set()    for item in items:        val=item if key is None else key(item)        if val not in s:            s.add(val)            yield itemprint(list(func(1,key=lambda dic:(dic['name'],dic['age'],dic['sex']))))

八、数据类型总结

按存储空间的占用分（从低到高）数字字符串集全：无序，即无序存索引相关信息元组：有序，需要存索引相关信息，不可变列表：有序，需要存索引相关信息，可变，需要处理数据的增删改字典：无序，需要存key与value映射的相关信息，可变，需要处理数据的增删改

按存值个数区分

标量/原子类型数字，字符串

容器类型列表，元组，字典

按可变不可变区分

可变列表，字典

不可变数字，字符串，元组

按访问顺序区分

直接访问数字

顺序访问（序列类型）字符串，列表，元组

key值访问（映射类型）字典

九、运算符

#身份运算（is, is not)is 比较的是id，而双等号比较的是值毫无疑问，id若相同则值肯定相同，而值相同id则不一定相同>>> x=1234567890>>> y=1234567890>>> x == yTrue>>> id(x),id(y)(3581040,31550448)>>> x is yFalse

详细：http://www.cnblogs.com/linhaifeng/articles/5935801.html#_label34

十、字符编码

http://www.cnblog.com/linhaifeng/articles/5984922.html

python-day2数据类型

内容介绍

1.什么是数据？

2.为何数据要分不同的类型

3.数据类型

4.按照以下几个点展开数据类型的学习

数字

长整形（了解# ）

复数（了解）

字符串

四、列表

练习：

五、元组

练习

字典

练习

集合

八、数据类型总结

按存值个数区分

按可变不可变区分

按访问顺序区分

九、运算符

十、字符编码

个人收藏笔记记录

内容介绍

1.什么是数据？

2.为何数据要分不同的类型

3.数据类型

4.按照以下几个点展开数据类型的学习

数字

长整形（了解# ）

复数（了解）

字符串

四、列表

练习：

五、元组

练习

字典

练习

集合

八、数据类型总结

按存值个数区分

按可变不可变区分

按访问顺序区分

九、运算符

十、字符编码

个人收藏笔记记录

开通VIP