搜狗输入法离线状态下如何手动安装细胞词库?

离线无网也能装细胞词库:下载sgpy文件→设置→词库管理→手动导入→重启生效,全平台通用
功能定位:为什么仍需要离线手动安装
在 2026 版搜狗输入法里,「细胞词库」依旧是专业术语、垂直黑话与网络新词的第一落点。虽然账号云同步已能在 3 秒内把 20 万条个人词汇拉到本地,但高铁、会议室、鸿蒙 NEXT 隐私围栏等「无网场景」下,离线包反而更稳;同时,企业内网、涉密主机根本不允许登录账号,手动导入就成了唯一合规通道。
手动安装的核心价值不是“替代云”,而是给网络不可控环境留一条「词级逃生通道」。理解这一点,就能明白官方为何在 v13 之后仍保留「从本地文件导入」入口——它解决的是合规与可达性问题,而非单纯增量词库。
版本演进:离线词库接口的三次迁移
v11 及以前:裸放 *.scel 时代
早期搜狗使用 *.scel 二进制格式,用户把文件丢进安装目录下的 Dict\Cell 文件夹重启即可。优点是简单粗暴;缺点是 Win10 以后高 DPI 屏经常因为权限缓存导致「词库不生效」,而且 macOS 端不认 Windows 编码,跨平台会乱码。
v12–v13.5:在线优先,本地入口折叠
搜狗把「我的词库」全面云化,PC 端设置面板甚至一度把「手动导入」收进「高级」三级菜单,导致大量老用户误以为功能被砍。此阶段官方主推「扫码一键分发」,离线包仅保留向下兼容,格式也同步升级到 sgpy(实质是带签名的 zip),用于校验完整性。
v13.7.1 至今:隐私围栏带回离线刚需
2026 年 2 月推送的 v13.7.1 重新把「本地词库管理」放回一级菜单,并新增「批量签名验证」开关——默认开启,可手动关闭以兼容老旧 scel。官方日志里写的是「满足政企离线部署」,其实也给普通用户开了后窗:不登录、不联网、也能注入细胞词库。
操作路径:三平台最短可达入口
前置条件
1. 已准备好扩展名为 .sgpy(推荐)或 .scel 的细胞词库文件;
2. 搜狗输入法为 v13.7.1 或更高;
3. 若设备处于「隐私围栏」模式,请先关闭「禁止外部词库」选项(路径见下方)。
Windows 10/11 PC
- 右键任务栏「搜狗状态栏」→ 设置属性 → 词库 → 本地词库管理 → 手动导入 → 浏览选择 *.sgpy → 确认。
- 若导入按钮灰色,检查是否开启「签名验证」:同一窗口右上角「高级」→ 取消「只允许官方签名」→ 再次导入。
- 导入成功后提示「立即重启生效」→ 点击重启;若跳过,新词将在下次手动切换输入法或重启系统后加载。
Android 14 及以上(含 HarmonyOS 4.2)
- 把 sgpy 文件存进手机 Download 目录(避免用中文路径)。
- 进入搜狗键盘 → 左上角「搜狗图标」→ 更多设置 → 词库与表情 → 我的词库 → 右上角「⋮」→ 手动导入 → 系统文件选择器选中文件。
- 导入完成会弹出「是否立即同步到账号」→ 离线场景点「取消」即可,词库已写入本地沙盒。
macOS 13+
- Finder 中把 sgpy 放到 ~/Library/Application Support/Sogou/CellDict/。
- 顶部菜单栏「搜狗」→ 偏好设置 → 词库 → 本地管理 → 刷新列表 → 勾选刚放入的文件 → 应用。
- macOS 版无签名验证开关,若格式错误会提示「无法识别」;此时请回到 Windows 端用「词库工具」转码再导出。
常见失败分支与回退方案
| 现象 | 最可能原因 | 验证方法 | 处置 |
|---|---|---|---|
| 导入按钮灰色 | 文件扩展名大小写不一致;或隐私围栏禁止外部词库 | 重命名 .sgpy → .SGPY 仍灰;检查设置-隐私-外部词库开关 | 关闭「禁止外部词库」或把文件改为小写扩展名 |
| 提示「签名损坏」 | 下载过程被代理篡改;或老版 scel 被强制验签 | 把同一文件拿到 Win 端关闭签名后导入,能成功即证明签名校验失败 | 临时关闭「只允许官方签名」或重新下载词库 |
| 重启后词库消失 | 企业组策略每次开机还原镜像;或账号云同步把空配置覆盖回来 | 断网重启,若词库仍在,则证明被云同步冲掉 | 退出账号→导入→再开启「仅本地不同步」 |
兼容性对照:sgpy 与 scel 怎么选
sgpy 是 2025 年后推出的签名打包格式,内部含 xml 词表、版本号与校验哈希;scel 是 2010 年起的老二进制。两者在 v13.7.1 都能被识别,但差异显著:
- 跨平台:sgpy 统一 UTF-8,macOS 与 HarmonyOS 不会乱码;scel 在 macOS 常因 GBK 转码失败而空白。
- 体积:同一词库 sgpy 比 scel 大约 15%,但自带索引,首次加载快 30%(经验性观察,验证方式:对比 10 万词条文件导入后重启耗时)。
- 安全:政企招标要求「可验签名」时,必须 sgpy;个人用户可关闭校验无感导入。
工作假设
若你仍在维护 2018 年前的老 scel 词库,可先用搜狗官方「词库工具(截至当前的最新版本提供)」批量转码 → 导出 sgpy,再分发到各端,能显著降低乱码率。验证指标:macOS 端导入后,用「测」字测试原编码词条是否能正常联想。
何时不该用离线导入
- 团队大于 50 人且词条日变更:离线包无法做增量,一旦修改就要全员重发,维护成本指数级上升。
- 涉密单机但需审计:离线 sgpy 没有日志回传,安全审查要求「谁导入、何时、何内容」时,你无法出具原始记录。
- 动态热词场景:电商大促价格、证券简称每日变,离线包生命周期按「周」算都嫌慢,此时应改用「热词 API」或「剪映字幕流」实时通道。
最佳实践清单(可打印)
- 统一命名:品牌-领域-日期,例:Sogou-Legal-20260309.sgpy,方便回滚。
- 版本控制:用 Git 管理 sgpy 源文件(实质是 zip),diff 可读。
- 灰度发布:先给 5% 终端推送,观测 24h 无崩溃再全量。
- 回退通道:保留上一版 sgpy,出问题 30 秒内可「删除→导入旧包→重启」。
- 定期清理:季度归档久未更新的词条,减少索引膨胀导致的候选框卡顿(经验性观察:>30 万条后首次弹窗延迟可感知)。
FAQ:手动安装细胞词库常见疑问
离线导入后,云同步会覆盖本地吗?
若账号级「词库同步」开启且云端为空,首次同步会把本地词条上传;反之若云端已有同名词库,会以云端为准。避免被覆盖,可在「设置-账号-同步选项」里关闭「细胞词库」单项,再执行导入。
sgpy 能否反编译回纯文本?
sgpy 实质是签名 zip,把扩展名改为 .zip 即可解压得到 words.xml,用文本编辑器即可查看。但官方签名会失效,再次导入需关闭签名校验。
iOS 版为什么找不到手动导入?
截至当前的最新版本,iOS 因系统沙盒限制未开放本地文件导入,仅支持「扫码装词库」或「账号同步」。如需离线,可借 macOS 端中转:AirDrop 传 sgpy → mac 版导入 → 同一 iCloud 账号同步到手机。
导入失败却无提示怎么办?
打开「关于」界面,连续点击版本号 5 次,会弹出调试日志窗口;重复导入一次,查看 log 中「CellDict::Import」行,若显示「-3」表示格式错误,「-9」表示签名失败,可对号入座处理。
词库太大导致卡顿,如何拆分?
官方建议单包 <10 万词条。可用「搜狗词库工具」→ 高级 → 拆分 → 按字母前缀或行业字段切成多包,再分别导入;拆包后首次加载内存占用下降约 40%(经验性观察,验证:任务管理器对比搜狗进程峰值)。
验证与观测方法
想量化离线词库是否生效,可建一个「人造生僻词」做探针:例如「䲜鰻鱻」。把它写进 sgpy 并导入,然后在无网环境下输入「yemanxian」,若候选栏首位出现「䲜鰻鱻」,说明索引已落盘。再于 24 小时后重启电脑,重复测试,若依旧首位,则证明未被云同步冲掉。
收尾:一句话记住流程
离线装细胞词库只需「下载 sgpy → 设置 → 词库管理 → 手动导入 → 重启」,全程不联网、不登录、不留云痕;当你下次坐在没 Wi-Fi 的会议室,却还能秒出行业术语,就会感谢这条 30 秒捷径。
下一步行动:把本文最佳实践清单另存为 PDF,贴进团队共享盘;再给自己建一个「日期-领域」命名的 sgpy 模板,下次有新词,5 分钟就能打包分发,彻底告别「没网就裸奔」的输入焦虑。