我写了一个脚本,绑定一个 http 服务,用另一个设备的浏览器打开后,在里面输入文本,可以捕获输入文本、按键,同步到 server 端。主要用途是:在电脑上运行这个服务,在手机浏览器上打开这个页面,就可以在手机端进行语音输入,将键入事件同步到电脑端。
相关代码在:github: web_remote_input
使用图片:
下面的问题需要懂前端的朋友解答。
这个实时输入的实现,就是在 textarea 下注册了一系列的事件监听:
messageInput.addEventListener("compositionstart", start_chinese);
messageInput.addEventListener("compositionend", finish_chinese);
messageInput.addEventListener("input", send_input);
messageInput.addEventListener("paste", send_paste);
messageInput.addEventListener("keydown", send_key);
messageInput.addEventListener("click", clear_text);
然后把这些事件通过 socketio 发给 server 端:
// 开始输入中文
function start_chinese(event) {
messageInput.isComposing = true;
}
// 结束输入中文
function finish_chinese(event) {
// 清除正在输入中文的标记
messageInput.isComposing = false;
// 发送中文内容
socket.emit("word", event.data);
}
// 发送输入的字符
function send_input(event) {
if (event.inputType === "insertText") {
// 发送插入的字符
var message = event.data;
socket.emit("input", message);
}
}
在安卓上时,在输入框里使用语音输入,这个输入框会收到 insertFromComposition
类型的 input
事件。
但在 iOS 设备上,用原生输入法的语音输入功能,出了意外,会收到一系列的 insertText 事件,但没有收到任何 deleteContentBackward 事件。然而,输入框中的文本的表现是之前输入的文本被更新了。
当我用语音输入说 「快速地飞过。」 时,这是事件记录:
before_input_event: {'inputType': 'insertText', 'data': '快', 'targetValue': ''}
input_event: {'inputType': 'insertText', 'data': '快', 'targetValue': '快'}
before_input_event: {'inputType': 'insertText', 'data': '快速', 'targetValue': '快'}
input_event: {'inputType': 'insertText', 'data': '快速', 'targetValue': '快速'}
before_input_event: {'inputType': 'insertText', 'data': '快速。', 'targetValue': '快速'}
input_event: {'inputType': 'insertText', 'data': '快速。', 'targetValue': '快速。'}
before_input_event: {'inputType': 'insertText', 'data': '快速的。', 'targetValue': '快速。'}
input_event: {'inputType': 'insertText', 'data': '快速的。', 'targetValue': '快速的。'}
before_input_event: {'inputType': 'insertText', 'data': '快速地飞过。', 'targetValue': '快速的。'}
input_event: {'inputType': 'insertText', 'data': '快速地飞过。', 'targetValue': '快速地飞过。'}
before_input_event: {'inputType': 'insertText', 'data': '快速地飞过。', 'targetValue': '快速地飞过。'}
input_event: {'inputType': 'insertText', 'data': '快速地飞过。', 'targetValue': '快速地飞过。'}
这些输出,明显就是语音输入的时候,分段识别的回调结果,同步到前端了,覆盖了之前的识别结果,于是在手机端最后显示的结果就是「快速地飞过。」,但当这一连串捕获的 input event 传到电脑端后,就会是「快快速快速。快速的。快速地飞过。快速地飞过。」
我的猜想是,可能有我没有捕获到的其他事件,允许语音输入直接覆盖之前输入的文本。有没有办法捕获原始更新操作,或者了解为什么输入事件与输入框中的实际文本不一致?