最新文章
  • python3 typing 返回结果中出现None 或者是参数有两个或两个以上的数据类型

    python3 typing 返回结果中出现None 或者是参数有两个或两个以上的数据类型如下所示:def foo(x:int)->str:     if x==1:         return 'good'     else:         return None以上方法,会返回两个值,一种

    python 816 人阅读 0 条评论
  • django orm使用sql语句,进行多表联合查询(join on,left join)

    背景:由于使用Manager.raw()无法满足执行sql语句需求,因为我要执行是没有明确指定映射到模型的查询语句。对象 django.db.connection 代表默认数据库连接。要使用这个数据库连接,调用 connection.cursor() 来获取一个指针对象。然后,调用 cursor.execute(sql, [params]) 来执行该 SQL 和 cursor.fetchone(),或 cursor.fetchall() 获取结果数据。例如:from django.db import connectiondef my_custom_sql

    Django 2058 人阅读 0 条评论
  • 知识图谱管理系统

    知识图谱的常见查询是以谓词为常量的查询Virtuoso一个将整个只是图谱数据存储于一个大关系表中的系统Jena基于属性表存储方式的知识图谱数据管理系统gStore基于邻接表存储方式构建了一个知识图谱数据管理系统BitMat基于邻接矩阵存储知识图谱系统,BitMat针对谓词的查询以及基于主体和客体的查询会非常高效。Neo4j一个符合ACID标准的事务性数据库,而且具有图数据存储和管理功能,在Neo4j中,属性图中的节点、边以及属性都以固定长度记录的形式分别存储在不同的文件中。节点记录维护者指向其相邻边和属性的指针;边记录维护者指向其相邻点和属性的指针;属性记录维护者指向其所对应的具体属性值。因为

    知识图谱 806 人阅读 0 条评论
  • python3 中文繁体转换简体,简体转换为繁体,汉字转换拼音

    SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。githubhttps://github.com/isnowfy/snownlp 汉字转换拼音样例代码:from snownlp import SnowNLP s = 

    python 665 人阅读 0 条评论
  • python3 json.dumps参数ensure_ascii=False 解决中文保存不是乱码

    在使用json.dumps(dict),如果字典中含有汉字,必须要加上参数ensure_ascii=False,否则json.dumps的结果所有字符串都是用ascii来显示,而汉字不存在ascii的字符集中,因此经过json.dump后,汉字字符串会变成对应的unicode编码。如下所示:{"basic_dict": {     "所处时代": "唐朝",     } } ## json.dumps() {"ba

    python 861 人阅读 0 条评论
  • python3 request.urlretrieve 添加请求头下载图片

    python3 request.urlretrieve 添加请求头下载图片import urllib.request opener = urllib.request.build_opener() opener.addheaders = [('User-agent', 'Mozilla/5.0')] urllib.request.install_opener(opener) urllib.request.urlretrieve("type URL here",&n

    python 507 人阅读 0 条评论
  • Django ORM between and 用法

    Django ORM between and 用法sql语句:SELECT * FROM target WHERE ctime BETWEEN '2020/1/1 00:00:00' AND '2020/1/1 23:59:59'Djanog ORMfrom datetime import date from datetime import timedelta from datetim

    Django 1119 人阅读 0 条评论
  • python3 requests 爬虫请求头解决gzip, deflate, br中文乱码问题

    使用python3做爬虫的时候,一些网站为了防爬虫会在请求头设置一些检查机制,因此我们就需要添加请求头,伪装成浏览器正常访问。字段情况,详见下表:请求头字段说明响应头字段Accept告知服务器发送何种媒体类型Content-TypeAccept-Language告知服务器发送何种语言Content-LanguageAccept-Charset告知服务器发送何种字符集Content-TypeAccept-Encoding告知服务器采用何种压缩方式Content-Encoding"Accept-Encoding":是浏览器发给服务器,声明浏览器支持的编码类型。一般有gzip,d

    爬虫 1576 人阅读 0 条评论
  • requests 保存cookies和读取cookies

    requests 保存cookies和读取cookies在会话中保留状态,可以使用request.Session()# 获取cookie url = 'http://www.baidu.com' r = requests.get(url) r.cookies # 将CookieJar转为字典: cookie_dict= requests.utils.dict_from_cookiejar(r.cookies) # 将字典转为CookieJar: cookies = reque

    爬虫 424 人阅读 0 条评论
  • mysql sql 删除重复数据只保留一条

    背景:在people表中上万条记录里,存在着些相同的记录,字段位:gci_id。需求:如何能用SQL语句,获取出重复的数据并且删除重复的数据,并只保留一条实现1. 查找表中多余的重复记录,重复记录是根据单个字段(gci_id)来判断select * from people where id in (select id from people group by gci_id having count(gci_id) > 1)havi

    mysql 982 人阅读 0 条评论