Capo (1988) considera que el maxi (maxí) y el gun (gungbè) como parte del complejo dialectal fon.
Muchas de las oclusivas sonoras aparecen solo ante vocales orales, mientras que grupos de oclusivas homorgánicas solo aparecen ante vocales nasales, lo cual indica que [b] [m] y [ɖ] [n] son alófonos, no fonemas distintivos en fon.
[ɲ] aparece en variación libre con [j̃]; por tanto, puede argumentarse que el fongbe no posee fonemas nasales distintivos, y sus sonidos nasales solo son variantes de oclusivas sonoras; este patrón es común en toda África occidental.
Los únicos grupos consonánticos posibles en fon tienen a una de las dos aproximantes /l/ o /j/ como segunda consonante; tras (post)alveolares, /l/ se realiza opcionalmente como [ɾ]: klɔ́ 'lavar', wlí 'agarrar, coger', jlò [d͡ʒlò] ~ [d͡ʒɾò] 'querer, desear'.
Las palabras básicas dislábicas pueden presentar cualquiera de las cuatro posibilidades lógicas: alto-alto, alto-bajo, bajo-alto y bajo-bajo.