首先解析淘宝API返回的XML结构,使用Python的xml.etree.ElementTree解析订单号、买家信息、商品详情等字段,注意处理命名空间、空值及编码问题,并建议封装函数用于数据库存储或导出报表。
淘宝API返回的XML数据,比如订单信息,通常是以结构化的格式传输的。处理这类XML文件或数据,核心是解析XML内容并提取你需要的字段,例如订单号、买家信息、商品详情等。下面介绍几种常见且实用的处理方式。
淘宝开放平台(如TOP API)返回的XML通常有固定格式。例如调用taobao.trade.fullinfo.get接口获取订单详情时,返回可能类似:
12345678901234 小明同学 WAIT_SELLER_SEND_GOODS 张三 北京市朝阳区xxx街道 1234567890123 iPhone手机壳 29.90 2
你需要根据文档确认标签含义,重点关注tid(交易编号)、buyer_nick(买家昵称)、receiver_*收货信息、orders/order子订单列表等。
常用语言都支持XML解析,以下是Python示例,使用内置的xml.etree.ElementTree库:
import xml.etree.ElementTree as ET假设response_text是API返回的XML字符串
response_text = '''
''' 12345678901234 小明同学 WAIT_SELLER_SEND_GOODS 张三 北京市朝阳区xxx街道 1234567890123 iPhone手机壳 29.90 2 解析XML
root = ET.fromstring(response_text)
提取主订单信息
tid = root.find('.//tid').text buyer_nick = root.find('.//buyer_nick
').text status = root.find('.//status').text receiver_name = root.find('.//receiver_name').text receiver_address = root.find('.//receiver_address').text
print(f"订单号: {tid}") print(f"买家: {buyer_nick}") print(f"状态: {status}") print(f"收货人: {receiver_name}") print(f"地址: {receiver_address}")
遍历子订单
for order in root.findall('.//orders/order'): oid = order.find('oid').text title = order.find('title').text price = order.find('price').text num = order.find('num').text print(f"商品: {title}, 单价: {price}, 数量: {num}")
0表示成功,非0为错误码,需先判断再解析。基本上就这些。只要搞清楚XML结构,用合适的工具解析,就能高效处理淘宝订单数据。不复杂但容易忽略细节,尤其是空值和异常情况。建议封装成函数重复使用。