我在www.cmoa.jp上购买的日文小说在web里都是以canvas图片的形式呈现,目前我一直用下载器或批量截图之类的截取下来+OCR识别文章再进行机器翻译阅读。不过OCR多少有些错误,其APP下载的书限制复制20字且没有DeDRM的方法。
· 现在网页F12控制台中发现binb中sbc有个文件有猫腻,里面有一堆utf-16编码,转换了全是日文原文,比如 \u30fc\u30ea 转换为 ーリ 。但夹杂在这些utf-16编码中有一些奇怪的编码对应Binb网页阅读器里的位置很可能也是日文文本,比如 &$4jusm;&$522d8;&$50q5y; 对应日文 シスン
**这些奇怪的编码到底是什么?如何进行转换?**
附:不要建议我在亚马逊或乐天那类平台购买,虽然DeDRM这两个平台的书很容易,但优惠力度都不如cmoa
关注
你确定&$4jusm;&$522d8;&$50q5y能对上シスン,シスン没有其他对应的编码吗?
如果是OCR的话考虑换云服务去识别吧
你去随便开一本免费的书看看就知道是不是如提问所说的了
啊…我直接看日文不用翻译的呀只是觉得如果是混淆不应该这样做而已。
好吧,有可能是对原文文本随机选择小段落进行加密以防全文直接复制
折腾这些奇奇怪怪的编码浪费的时间,不如直接去亚马逊或乐天买咯,要考虑一下时间成本
不能dedrm等于白费钱,再便宜有啥用,能dedrm不是大前提吗
试看的有DRM 吗
js逆向一下
加盐防盗
&$4jusm;&$522d8;&$50q5y 试看的也有这类乱码,那个应该不是DRM,按照上面说法,可能JS逆向就能找到解密方法