搜索引擎爬虫的基本需求和考核标准 2010/7/9 Uncategorized 需要包含以下基本功能: (1)网站下载流速控制 国内国外的搜索爬虫,科研机构爬虫数量很多,不同的站点抗抓取能力大相径庭,对网站的下载做好控制,避免将网站抓死。 (2)网页抓全 将互联网网页抓全,是极大的挑战,暗网暂且不提,就是明网抓全也不是容易的事情,新站发现,sitemap协议等用站长主动提交的支持等等。… 阅读
关于人像修饰与磨皮 2010/1/31 Uncategorized 先来说一下这个片子的处理思路步骤: 首先,用”污点修复画笔”就是长的象创可贴的那个工具,将MM脸上的斑点去除,这个很容易,只要在上面轻轻一点既可 经过分析发现原片的面部偏暗,用曲线将面部调亮,我想这一步不需细说… 阅读
浅谈。。。。。 2009/1/7 未分类 2009,注定是一个不安稳的一年,以IBM为首的国际巨头,已经开始了更为吃惊的复杂大型数据处理–云计算,在云计算横向演绎出来的则是相关的技术,比如百度即将推出暗网搜索,goole更疯狂开始自己分布在世界范围内所有数据的集中处理。自己很认真的想过,如果不接触大型数据,那么,其实很多复杂的架构以及数据处理可以不去接触,把精力放到业务处理上,更为人性的工作流,时机成熟,去做一套自己研发的ERP。… 阅读