Sin embargo, incluso para esos idiomas, la segmentación del texto es a menudo mucho más fácil que la segmentación del habla, porque la lengua escrita generalmente tiene poca interferencia entre las palabras adyacentes y, a menudo, contiene pistas adicionales que no están presentes en el habla (como el uso de caracteres chinos para los vástagos de palabras Japonés).
Aunque no se cree que los bebés utilicen el reconocimiento léxico en su primer año, debido a su vocabulario muy limitado, es uno de los principales procesos involucrados en la segmentación del habla para adultos.
En general, la investigación en sistemas de reconocimiento léxico humano está limitada debido a la poca evidencia experimental que discrimina completamente entre los tres modelos principales.
Si bien la probabilidad de "netshop" es extremadamente baja, ya que "netshop" no es actualmente un compuesto o frase en inglés, y "sweatshop" también parece improbable en el contexto, "tienda de mascotas" es una buena opción porque es una frase común y También está relacionado con la palabra "perro".
En inglés, los oradores perciben que la palabra "strawberry" (fresa) consiste en (fonéticamente) dos partes: "straw" (paja) y "berry" (baya).
Otras interpretaciones como "stra" y "wberry" están inhibidas por la fonotáctica en inglés, que no permite la palabra "wb" del grupo inicialmente.
Otros ejemplos de este tipo son "day / dream" y "mile / stone", que probablemente no se interpretarán como "da / ydream" o "mil / estone" debido a la probabilidad fonótica o improbabilidad de ciertos grupos.La frase "Cinco mujeres se fueron", que podría transcribirse fonéticamente como [faɪvwɪmɘnlɛft], está marcada ya que ninguna / vw / in / faɪvwɪmɘn / o / nl / in / wɪmɘnlɛft / está permitida como inicios de sílabas o codas en fonotácticas en inglés.
Por lo tanto, en compuestos como "selkä / ongelma" ('problema de espalda') donde la armonía vocal es distinta entre dos constituyentes en un compuesto, el límite estará donde sea que tenga lugar el cambio en armonía, entre "ä" y "ö "en este caso.
Dado que los bebés aún no han adquirido un léxico capaz de proporcionar pistas contextuales extensas o búsquedas de palabras basadas en la probabilidad dentro de su primer año, como se mencionó anteriormente, a menudo deben confiar principalmente en señales fonotácticas y rítmicas (con la prosodia como la señal dominante), todas que son específicos del idioma.
Aunque se necesita mucha más investigación sobre los procesos exactos que utilizan los bebés para comenzar la segmentación del habla, los estudios actuales y pasados sugieren que los bebés nativos del inglés se acercan a las sílabas acentuadas como el principio de las palabras.