import re import json s =['''
丹·琼斯(Dan Jones), 杰弗里·瓦夫罗(Geoffrey Wawro), 克里斯托弗·希伯特(Christopher Hibbert), 罗斯·金(Ross King)等等。
''', '''
马克·哈里斯黎绮妮
''', '''
马克·哈里斯黎绮妮
''', '''
[美]威廉·厄本(William Urban), 陆大鹏刘晓晖
''', '''
[英]安德鲁·罗伯茨(Andrew Roberts)苏然
''', '''
[英]安德鲁·罗伯茨(Andrew Roberts)苏然
''', '''
堀田江理(Eri Hotta)
''', '''
景跃进, 张小劲余逊达
'''] for t in s: ret = re.split('|<\/span',t) fret = ret[3::4] #print(json.dumps(re.split('|<\/span',t), indent=2, ensure_ascii=False)) print(','.join(fret))