Excel 中的数据类型 引言如果经常使用 Excel 进行数据管理、分析的话,你一定遇到过以下几种情况: 输入好好的身份证号,一转眼后三位就变成了“000” 明明看起来是一样的日期,有的可以改变显示方式,有的改不了 数字单元格,莫名其妙出现了小三角,求和的时候,结果对不上 …… 这些问题,都是不了解 Excel 数据类型导致的。 2016-08-24 技术文档 #数据类型 #Excel #科普
BeautifulSoup 和 json 库在爬虫项目中的应用 在重构人人贷爬虫的过程中,主要要爬取的数据是以 json 数据的格式呈现的,要提取的 html 内容如下: 2016-08-22 技术文档 #Python #BeautifulSoup #json #爬虫
重构人人贷爬虫程序(released) 重构已经完成并发布,在原项目地址,有空之后再写新版本的说明 之前曾经写过一个爬取人人贷交易数据的爬虫,主要用到了 urllib2 包进行请求,通过re包正则表达式进行提取数据,考虑到需要登陆进行爬取时,urllib2 不如requests 更稳定,同时较为复杂的正则表达式效率较低,准备通过 requests 包和bs4 进行重构,特开贴记录重构过程中的问题和思考。 2016-07-21 技术文档 #Python #爬虫 #人人贷
通过 Python 获取摄像头数据 环境配置 Python 2.7+ VideoCapture-0.9-5 PIL(Python Imaging Library) PIL 1.1.7 win32 | PIL 1.1.7 amd64 2016-07-19 技术文档 #Python #摄像头 #监控
Python 读写操作 Excel 文档(xlrd/xlwt) Python 可以通过两个第三方包来操作 Excel 文档: xlrd:https://pypi.python.org/pypi/xlrdxlwt:https://pypi.python.org/pypi/xlwt 2016-05-23 技术文档 #Python #Excel #library
通过 Python 脚本快速统计分析日志 从朋友那里拿到一个需求,根据日志分析统计并发情况,统计自定义时间段的用户流量,具体需求如下: 晒选某个时间点的数据:查找某天下午1:30到2:30这个时间段或者自己定义,看看到底有多少 同时筛选出两个项目标号的文档,统计和去重统计17/18 babyhealth:[2016-05-03 19:21:23] INFO orderinfo:472 - v41/nbCode 2016-05-05 技术文档 #Python #日志 #自动化
通过 .htaccess 文件将域名解析到多个目录 对于一台主机而言,同时搭建两个网站可以更好的利用主机的剩余资源,但是,有些主机供应商并不提供子域名解析,或者需要解析到不同的域名,对于这种情况,可以通过建立 .htaccess 文件加入 rewrite 函数的方法实现,本方法仅适用基于 Apache 搭建的服务器,基于 nginx 搭建的服务器需要在 nginx.conf 中添加 rewrite 函数(之后另行介绍)。 2016-04-15 技术文档 #互联网 #Apache #域名 #子目录 #解析
启用 ScanDir 解决 WordPress 不识别主题及翻译无限更新的问题 在自己的服务器上部署了 LNMP 环境,之后在部署 WordPress 时,发现无法识别已经安装的主题,点开主题后只显示正在使用的主题,且没有办法切换,在仪表盘中,始终弹出有翻译可以更新,但是每次更新之后都无效的问题。 经过排查发现是安装 PHP 时,禁用了 ScanDir 函数,启用该函数后,问题解决。 解决过程: 2016-04-14 技术文档 #CentOS #PHP #WordPress #互联网
CentOS 7 搭建 Samba 服务器 安装 Samba1sudo yum -y install samba samba-client samba-common 检查是否安装成功1rpm -qa | grep samba Configure SambaShareName Path RightsSHAREDOCS /smb/docs All include guestRDDOCS /smb/ 2016-03-03 技术文档 #CentOS #Linux #Samba