山东大学自行车协会论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

楼主: 宋世豪
打印 上一主题 下一主题
收起左侧

Ta, 还是你心中的那个Ta吗?

[复制链接]
1#
发表于 2020-2-17 22:04:48 | 显示全部楼层
@宋世豪, 你好。

会刊目前遇到安全方面的考虑,有一个技术上面的问题:

替换目标字符串为汉语拼音

需求是:

输入是 utf-8编码中文纯文本.

替换目标字符串为汉语拼音.

一个例子:

张三 被替换成 Zhangsan

不知闲暇时间,有意贡献 Python 代码么?

详细请参见:
https://github.com/casdu/securit ... uecomment-587003192

点评

没写过这种,不过我可以去git里看看有没有类似的项目  发表于 2020-2-18 12:19
本楼点评(0) 收起
回复 支持 反对

使用道具 举报

2#
发表于 2020-2-18 13:34:03 | 显示全部楼层
本帖最后由 casdu_ran 于 2020-2-18 13:37 编辑

@宋世豪

如果是简单的字符串替换很简单的。我们知道了 张三 对应 zhangsan 李四 对应 lisi ,只要我们有一个列表就好了。但是如果是对纯文本处理,在没有这个列表的情况下,让程序自己识别文中的名字,就困难了。 如果有兴趣的话,留下 GitHub 的帐号,我们一起来玩?
目前对这个 https://github.com/fxsjy/jieba 比较感兴趣。
本楼点评(0) 收起
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

展开

QQ|小黑屋|手机版|北大车协|车协主站

GMT+8, 2024-5-16 16:01 , Processed in 0.125706 second(s), 37 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表