Python爬取FLASH播放器中的资料。
一、首先了解一下AMF协议:
AMF(Action Message Format)是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层面上传输。现在很多Flash WebGame都采用这样的消息格式。
AMF协议是基于Http协议的.
它的内容处理过程大致是这样:
1.从客户端获取Http请求(Request)流.
2.对流进行解串行化(Deserialize),得到服务器端程序能够识别的数据,并建立一个响应(Response)消息
3.Debug开始
4.对流进行各种处理(记录、许可、服务)得到返回值
5.对响应流进行串行化
6.发送Http响应给客户端
二、Python与amf进行互通需要用到PyAMF
1、下载pyamfhttps://pypi.python.org/pypi/PyAMF
2、安装pyamf
下载完成之后解压出来,打开DOS命令进入pyamf目录,
执行下列命令,安装pyamf框架python setup.py install --disable-ext
三、获取关键字节伪造访问
首先使用charles抓包工具,抓取AMF包,得到请求/应答的AMF数据,对AMF格式的请求和响应的数据进行分析。
解密的POST DATA如下图所示:
构建flex.messaging.messages.RemotingMessage信息1
2
3
4
5
6
7
8
9
10
11msg= messaging.RemotiongMessage(messageId=str(uuid.uuid1()).upper(),\
clometOd=None,\
operation='playeSource',\
destination='metaDataService',\
timeTolive=0,\
timestamp=0
)
msg.body=['xxx', 'aaaaa', 'ccccc','ddddd', '', 'eeeee', '']
msg.headers['DSEndpoint']='my-amf'
msg.headers['DSId']=str(uuid.uuid1()).upper()
......
得到的Response如下图:
四、具体实现代码如下:
1 | import urllib2 |