这
isd-sr3000
是 一个 完全 embedded 演说
recognition 处理器. 它 组成 的 一个 演说 recognition
engine, 一个 演说 压缩 engine, 和 一个 recording
函数. 这
isd-sr3000
硬件 包含 一个 并行的
risc/dsp 核心 和 一个 优化 操作指南 设置, 一个 有伸缩性的
codec 接口, 和 一个 串行 host 控制 接口.
这 演说 recognition engine 使用 sophisticated hidden
markov 模型 (hmms), 这个 使能 recognition 的
持续的 演说 和 连接 digits. 一个 应用
组成 的 扬声器-独立 commands (选择 用 这
应用 developer), 连接 digits 和 扬声器-定义
commands. 这 扬声器-定义 commands 准许 用户 至
store 和 认识 voicetags 那 能 是 使用 为 custom
commands 或者 名字 列表 管理. 这 扬声器-定义
commands 使用 这 hmms, 供应 更 更多 强健的
效能 对照的 至 常规的 扬声器-依赖
commands. 这 扬声器-独立 commands, 这 音频的
prompts, 和 这 扬声器-定义 voicetags 是 贮存
在 外部 记忆, 准许 为 最大 应用
flexibility. 典型 存储 (所需的)东西 是 2kb 为 各自
前-定义 command, 2.5kb 为 各自 音频的 prompt, 和
3kb 为 各自 voicetag, 包含 这 模型, recording, 和
数据. 应用 commands 是 分隔 在 topics
演说 recognition
处理器 为 command
和 控制 产品
(menus), 和 起作用的 vocabulary 大小 governed 用 这
大小 的 这 外部 sram. 一个 开发 系统, 这
isd-ds3000
, 是 有. 这 开发 系统
包含 tools 为 compiling 和 sizing commands 和
prompts, 作 好 作 样本 c-代号 为 host 控制
程序 开发.
演说 recognition attributes
•
持续的 recognition
– 使活动 用 关键 文字 或者 leading silence
– rejects invalid vocabulary
– 用户 做 不 有 至 改变 演说 patterns
•
连接 数字 recognition
– 非 domain restrictions
– returned 之后 trailing silence
– 持续的 strings 和 inter-数字 pauses 允许
•
扬声器-独立 command recognition
– 非 用户 training 必需的
– 应用-明确的 commands
– 定义 用 这 应用 developer
– 号码 的 commands 决定 用 外部 记忆 大小
– 典型 产品 支持 向上 至 100 总的 words, 30 起作用的
在 任何 时间
•
扬声器-定义 voice tags
– 建造 从 hmm-为基础 acoustic 模型
– recording, 模型, 和 数据 为 各自 tag 贮存 在 外部
非-易变的 记忆
– 更多 强健的 比 扬声器-依赖 文字 模型
– 用户 enters 名字 仅有的 一个 时间
•
美国 english 和 同父母的 languages
– 联系 winbond 关于 language 开发
isd-sr3000
完美的 command
和 控制 产品
• 互联网 器具
• hands-自由 车 kits
• 控制 的 automotive accessories 和 系统
• desktop phones
• 仪器 控制
• 偏远的 控制 的 消费者 设备