悟の迹

You are my sunshine!


  • 首页

  • 归档

  • 分类

  • 标签

  • 更多

  • 关于

  • 搜索

2017-8-28 python interval 区间处理

发表于 2017-08-28 | 更新于 2018-02-24 | 分类于 Notes , Python | 评论数: | 阅读次数:
本文字数: 3.5k | 阅读时长 ≈ 3 分钟
1234567891011121314>>> volume1 = Interval.between("A", "Foe")>>> volume2 = Interval.between("Fog", "McAfee")>>> volume3 = I ...
阅读全文 »

2017-8-28 Pandas agg 使用lambda

发表于 2017-08-28 | 更新于 2018-02-24 | 分类于 数据分析 , Pandas | 评论数: | 阅读次数:
本文字数: 1.4k | 阅读时长 ≈ 1 分钟
12345678910111213141516171819import numpy as npimport pandas as pdN = 100data = pd.DataFrame({ 'type': np.random.randint(10, size=N), 'stat ...
阅读全文 »

2017-8-27 dataframe与序列相乘

发表于 2017-08-27 | 更新于 2018-02-24 | 分类于 数据分析 , Pandas | 评论数: | 阅读次数:
本文字数: 3.5k | 阅读时长 ≈ 3 分钟

情景描述:

继续完成项目中的评分卡部分,拿到分好箱的数据后,如何进行加权得到最后的分数就是我们接下来要考虑的问题了。

阅读全文 »

2017-8-27 python 协程加速

发表于 2017-08-27 | 更新于 2018-02-24 | 分类于 Notes , Python | 评论数: | 阅读次数:
本文字数: 3.6k | 阅读时长 ≈ 3 分钟

情景描述:

上周,由于产品嫌报告生成太慢,经过使用profile/gprof2dot研究后,发现主要时间耗费在接口网络请求上,于是我决定在项目中大量处理I/O网络请求的地方使用gevent,以缓解报告生成压力。

阅读全文 »

2017-8-27 Pandas 分箱操作(cut)

发表于 2017-08-27 | 更新于 2018-02-24 | 分类于 数据分析 , Pandas | 评论数: | 阅读次数:
本文字数: 4.6k | 阅读时长 ≈ 4 分钟

情景描述:

最新,项目中涉及到评分卡操作,评分项目有大概几十项,每项基本都是按频次区间给一个分数,最后,累计所有项目的分数得出最后所需要的分数。

阅读全文 »

2017-8-23 mongo insert_many BulkWriteError

发表于 2017-08-23 | 更新于 2018-02-24 | 分类于 Bug , Python | 评论数: | 阅读次数:
本文字数: 1.5k | 阅读时长 ≈ 1 分钟

问题:

在对mongo插入数据时,报写入问题,报错信息如下:

1
2
3
4
5
6
7
8
9
10
Traceback (most recent call last):
File "/root/crs/call_history_crawler/worker/communicate.py", line 149, in insert_db_data
if db[table].insert_many(data):
File "/root/crs/call_history_crawler/venv/lib/python2.7/site-packages/pymongo/collection.py", line 684, in insert_many
blk.execute(self.write_concern.document)
File "/root/crs/call_history_crawler/venv/lib/python2.7/site-packages/pymongo/bulk.py", line 470, in execute
return self.execute_command(sock_info, generator, write_concern)
File "/root/crs/call_history_crawler/venv/lib/python2.7/site-packages/pymongo/bulk.py", line 314, in execute_command
raise BulkWriteError(full_result)
BulkWriteError: batch op errors occurred

阅读全文 »
1234…7
Chihwei·Hsu

Chihwei·Hsu

The harder, the luckier

40 日志
11 分类
56 标签
RSS
GitHub E-Mail 简书 csdn
推荐网站
  • Next
0%
© 2017 – 2019 Chihwei·Hsu | 站点总字数: 83k | 站点阅读时长 ≈ 1:16
由 Hexo 强力驱动 v3.8.0
|
主题 – NexT.Gemini v6.6.0