我在格式一系列的地址线:12345某个地址,有些广场|电话号码|姓名从一个奇怪的大字符串中提取子串(重复字符)
例如:
40327 Ocie Camp Apt。 117,梅伍德| 1-155-932-2562 x738 |绍尔梅雷迪思
76106托马斯公路,圣安娜| 722.884.5632 |罗伯茨韦斯特利19056
贾马克斯里,朗代尔|(151)847-7455 x133 |哈格卡米尔66724滑
12-C,胡佛| 841.047.3195 x69422 | Trantow丹妮尔99824个费舍尔锁
#247,阿克伦城|(565)132-9970 x93939 | Wiza贝尔
我试图提取姓氏标准只有t。我试过典型的str.substring(str.indexOf(“|”),str.indexOf(“”)),但显然这导致错误的字符串被提取。
任何关于如何从这些字符串中获取姓氏的想法?
有没有在所有的“怪异的字符串”多个姓? –
编辑它 - 它们意味着分开的行。每行一个姓。 –
这是一个分隔字符串,因此将字符串拆分为一个正确的单元格:'s.split(“|”)[2]'。那么,为了只获得姓氏,你不能因为姓氏可以有空间 – AxelH