doodle博客日志下载成功

按照http://blog.dantup.com/2009/12/downloadingexporting-app-engine-logs.html的方法,无法成功地导出日志,只好向keakon请教了。
keakon把上传、下载、管理python应用的官方指南链接给我(Uploading, Downloading, and Managing a Python App,https://developers.google.com/appengine/docs/python/tools/uploadinganapp#Downloading_Logs),并且提示可能要开代理(坑爹的gfw,无所不封啊)
关于下载日志官方文档是这么写的

准备对博客做一些修改

最近有点忙,导致好久没有写博客了。今天抽空写一篇吧,不然就这里荒芜了。
根据自己当前的一些想法,准备抽个时间对本博客进行一些修改,目前想到的有下面这几个方面:
1、改变robots.txt的内容:

Disallow: /search
改为
Allow: /search/label/
Disallow: /search?
这么修改的目的是允许蜘蛛抓取tag页面,不允许抓取分页。
个人认为tag还是允许抓取比较好。

新浪微博尾巴添加成功

一波四折,新浪微博终于添加成功了,先秀一下图片

简要的说一下方法吧。
首先打开新浪开发者平台,网址是http://open.weibo.com/。
登录后点击网站接入,然后点开始接入,它会要求添加代码验证网站所有权和审核个人身份,
境内的网站需要备案,所以我放弃了我在bae上搭建的博客blog.tianrunlin.com,使用doodle.tianrunlin.com,证明境外网站我采用的是显示网址的ip信息,个人身份审核过程大概需要1到3天。
审核通过后就可以部署微连接了,我选择的是“发布到微博”。
接下来就是坑爹的申请提交过程了。
下面是我被驳回三次的邮件和最后通过的邮件。

2012年11月26日 下午3:35
尊敬的开发者您好:
  您的应用“田润林的博客”未能通过我方的来源文案审核,其原因是:“为保证您的网站组件上线正常运营,建议测试用户达到5人以上”。请您依据我们的建议和《微博开放平台审核指南》,再次修改后重新提交审核申请。查看常见驳回理由说明及解决方案 http://t.cn/zluaxfa。感谢您对新浪微博开放平台的支持!(忘了添加测试用户了,)

2012年11月27日 上午10:49
尊敬的开发者您好:
  您的应用“田润林的博客”未能通过我方的来源文案审核,其原因是:“没有看到合作组件上线或组件功能未实现,请更换应用图标,要求为8080的网站logo”。请您依据我们的建议和《微博开放平台审核指南》,再次修改后重新提交审核申请。查看常见驳回理由说明及解决方案 http://t.cn/zluaxfa。感谢您对新浪微博开放平台的支持!(好吧,我logo为7880,组件还没添加呢,我以为是先通过再添加组件呢)

2012年12月3日 下午3:18
尊敬的开发者您好:
  您的应用“田润林的博客”未能通过我方的应用来源文案审核,其原因是:“请更换应用图标,要求为8080的网站logo,没有看到合作组件上线或组件功能未实现”。请您依据我们的建议和《微博开放平台审核指南》进行修改,待提交审核冻结结束后重新提交审核申请。感谢您对新浪微博开放平台的支持!(我擦,我logo已经检查了,真是8080啊,组件也加了,估计是太小或者加载没有完成他们没看到。然后,然后,我的申请竟然被冻结了,在12月4日前禁止提交,无语了,为此我还专门发了封邮件给他们)

最后终于等到这封邮件了

2012年12月4日 下午4:01
尊敬的开发者您好:
  您的应用“田润林的博客”已经通过我方的来源文案审核,经由您的应用所发出的微博信息将会显示相应的来源文案,同时,您可以查看《微博开放平台审核指南》,对您的应用进行优化。感谢您对新浪微博开放平台的支持!

如何导出(下载)GoogleAppEngine(gae)日志到本地

在gae后台查询日志比较麻烦,一来加载速度不是很快,二来每页最多显示50条结果,如果结果很多的,需要一直翻页下去。
所以,导出日志到本地是一个替代方案,但是在控制面板上并没有导出日志的选项。
怎么办呢?我们可以通过Google App Engine Launcher的appcfg.py从GAE导出日志到本地进行分析。

运行如下的命令行
appcfg.py request_logs appname/ output.txt
记住用你自己gae应用的名字替换“appname”,
这个命令会从最后一天开始导出日志到output.txt

当然你也可以添加时间选项
appcfg.py —num_days=5 request_logs appname/ output.txt
这个命令会导出最后五天的运行日志

appcfg.py —num_days=0 request_logs appname/ output.txt
num_days=0代表导出所有的日志,所以这个命令会导出所有日志

如果你想导出你还没有导出日志,可以使用下面的命令
appcfg.py —append request_logs appname/ output.txt
它会扫描你已经下载日志,并下载你还没有下载日志。

—————-我是分割线————-选译自http://blog.dantup.com/2009/12/downloadingexporting-app-engine-logs.html-------
按照他说的方法不能导出日志,求解决方案啊

那些年爬过我页面的蜘蛛(爬虫、机器人)

在gae后台查看了一下日志(logs选项),发现下面的这些搜索引擎爬虫(蜘蛛)爬过我的页面(不完全统计),把它们名字和的打的旗号(使用的useragent)列出来:

msnbot/2.0b (+http://search.msn.com/msnbot.htm)
微软家的msn机器人

ia_archiver (+http://www.alexa.com/site/help/webmasters; crawler@alexa.com)
alexa家的爬虫

Mozilla/5.0 (compatible; AhrefsBot/4.0; +http://ahrefs.com/robot/)
ahrefs的外链机器人

给推特和新浪微博加个尾巴

推特的尾巴加起来很容易,doodle后台就有相关的模块。
成功后在doodle后台发送推文的效果图如下(貌似推特上看不了博客的发送来源,通过发微却能看到):

新浪微博网站接入还要进行审核ing,

等待审核通过后新浪也可以加尾巴了。

建站资源 – 5款免费的图片空间(支持外链)

对于新手建站来说,希望一切都是免费的,因为对于新手来说,什么都不是很了解,不愿意来过多的花费,在网站的内容更新当中,我们总是需要对于各个文章配上一些图片,这些图片不仅霸占了我们宝贵的主机空间,更是大大消耗了我们可怜的主机流量,去找一些图片空间也大多数收费,这对于我们新手来说更倾向于免费,这里提供5款免费的图片空间(支持外链)供大家选择。

使用cloudflare(CDN)加速自己的网站

又开始倒腾了,这次是捣腾的是cloudflare(CDN)。
先介绍一下相关概念

CDN

CDN的全称是Content Delivery Network,即内容分发网络。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳定。通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络,CDN系统能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。其目的是使用户可就近取得所需内容,解决 Internet网络拥挤的状况,提高用户访问网站的响应速度。

PR到2了

嗯,PR到2了,我才发现的,小惊喜。
最近实在太忙了,博客都没什么时间打理了。
搜了一下,发现更新发生在8天前(2012年11月8日)。
嗯,现在可以求友链了。