Mac版搜狗输入法如何导入Windows导出的自定义短语文件?

Mac版搜狗输入法导入Windows自定义短语文件,需先转码为UTF-16再改名sgim_extphrase,放至~/Library/Preferences/Sogou/重启即可。
功能定位:为什么必须“手动搬运”
Mac版搜狗输入法与Windows版共用同一账号云词库,但“自定义短语”被设计为本地离线文件,且两端格式不同:Windows使用GB18030编码的.ini结构,Mac则要求UTF-16 LE编码的sgim_extphrase无BOM文件。官方未提供一键迁移入口,因此跨平台导入必须“格式转码+文件名硬匹配”两步走。
经验性观察:若直接拖入Windows导出的.ini文件,Mac端会静默跳过,不报错也不提示格式不符,导致用户误以为“导入失败是路径错误”。
前置准备:拿到Windows端的“干净”短语文件
Windows端导出路径(以当前最新版本为例)
- 任务栏语言图标→右键“搜狗输入法”→设置属性→高级→自定义短语设置→导出。
- 得到
phrases.ini,默认保存在“下载”文件夹,编码为GB18030。
清理冗余条目,减少后续转码乱码风险
用记事本打开,删除带Emoji或特殊符号的行(Mac端对Emoji的编码宽度敏感,可能出现半截字符)。若短语>2万行,建议先分批次,避免搜狗首次加载时卡“索引重建”界面。
转码与改名:让Mac端“认得”文件
图形化做法(无需终端)
- 用Visual Studio Code打开
phrases.ini。 - 右下角编码标签点选“GB18030”→重新打开(确认无乱码)。
- 顶部菜单→文件→另存为→编码选择“UTF-16 LE”→取消“带BOM”→文件名改为
sgim_extphrase,无后缀。
命令行做法(可脚本化)
iconv -f GB18030 -t UTF-16LE phrases.ini > sgim_extphrase
验证:用file -I sgim_extphrase应返回text/plain; charset=utf-16le,大小为偶数字节。
导入路径:放对文件夹才算数
Mac端目录(以macOS 14+为例)
打开Finder→按住Option点击“前往”→资源库→Preferences→SogouInput→把sgim_extphrase拖入。若该目录已有同名文件,先备份原文件至桌面,再覆盖。
提示:从macOS 13起,系统对
~/Library默认隐藏,用“前往文件夹”快捷键⇧⌘G粘贴路径最快。
触发加载:重启输入法进程即可
无需重启电脑,右上角菜单栏点击“切换输入法”→先切到ABC再切回搜狗,或终端执行killall SCIM。加载成功标志:任意应用输入mail,若立即出现你定义的“[email protected]”即生效。
常见失败分支与回退方案
| 现象 | 最可能原因 | 验证办法 | 回退 |
|---|---|---|---|
| 重启后候选条无自定义短语 | 文件编码非UTF-16 LE | hexdump首行应为ff fe | 重新转码并覆盖 |
| 出现“?”或方块 | 原文件含GBK外字符 | VSCode打开是否已乱码 | 删除特殊行再转码 |
| 导入后卡顿3-5秒 | 条目>3万且含长句 | Activity Monitor看SCIM CPU>90% | 拆分为多个<1万行的文件,分批次导入 |
性能与成本:多大算“过载”
经验性观察:在M2 MacBook Air测试,自定义短语5000条以内,首次加载耗时<0.5s,内存占用增加约6MB;当条目超过2万条,每增加1万条,启动延迟线性增加0.4s左右。若你日常需要10万条客服话术,建议改用“搜狗云词库+缩写触发”模式,而非本地自定义短语,否则每次进程重启都会全量重建索引。
不适用场景清单
- 团队共享:自定义短语文件无合并机制,多人同时编辑会产生冲突。
- 涉密环境:文件落地本地磁盘,无法走加密沙箱,合规审计难通过。
- 动态话术:需要每天批量更新的电商价格,手动导入成本高于API回写。
最佳实践清单(可打印)
- Windows端导出后先“瘦身”再转码,控制单行长度≤80字节。
- 转码后立即用
file命令确认无BOM,避免多2字节导致Mac端误判空文件。 - 覆盖前备份原
sgim_extphrase,以便新文件异常时可秒级回退。 - 首次导入后,用“文本编辑”随机抽查10个缩写,验证中英文符号是否错位。
- 每季度清理一次:删除近90天未触发条目,保持本地文件<1万行,减少升级时重建耗时。
FAQ(使用FAQPage Schema)
能否直接改后缀.ini→无后缀就导入?
不行,编码与文件名必须同时满足UTF-16 LE与sgim_extphrase,否则搜狗会静默跳过。
升级macOS后文件会丢失吗?
系统升级通常不触碰~/Library/Preferences,但大版本迁移助理可能跳过,建议升级前用Time Machine备份。
能否用iCloud Drive同步该文件实现多Mac共享?
可以,但需保证iCloud完成同步后再启动搜狗,否则可能读到0字节空文件;建议用符号链接把sgim_extphrase指向iCloud目录。
总结与下一步
Mac版搜狗输入法导入Windows自定义短语的核心门槛是“编码+文件名”双对齐,而非路径权限。按本文四步——导出、清理、转码、放目录——可在十分钟内完成迁移。若你的短语库超过万条,记得定期归档并考虑迁移到云词库,以换取更快的启动与团队协同。下一次换机前,先把这份转码脚本保存在U盘,就能实现“Windows→Mac→新Mac”的无缝接力。