Sin embargo, a través del tiempo, se ha evidenciado un animado debate sobre los métodos proyectivos en general, y varios argumentos de este debate también se aplican a la prueba de Wartegg.
La validez del Wartegg ha sido cuestionada por autores como Tamminen y Lindeman[3] (2000).
El estudio presenta resultados que evidencian pocas correlaciones significativas con otros instrumentos utilizados con frecuencia en selección de personal.
Castrillón[6] (2004), expresa que son pocos los estudios que se conocen para su validación, ignorándose así la validez, la confiabilidad, la sensibilidad y especificidad, y observa con preocupación la utilización de esta prueba, pues se deja los resultados a la libre interpretación de quien observa, minándose su capacidad de discriminación debido a la subjetividad del evaluador.
[12] Varias investigaciones (por ejemplo, Eysenck (1947),[13] (1952);[14] Mira, (1951);[15] Himmelweit & Petrie, (1951);[16] Takala y Hakkarainen, (1953);[17] Eysenck, (1956)[18] han demostrado que las pruebas psicomotoras simples pueden ser desarrolladas y pueden ser utilizadas como medidas de personalidad.
Además, se ha demostrado que las reacciones simples sensorio motoras y los movimientos más complejos no siempre pueden ser considerados como categorías mutuamente excluyentes de las funciones psicomotoras, ya que tienen características comunes.
A pesar de varios análisis como por ejemplo: Brandt, (1954); Schmidt, (1956); Helm, (1959); Gottschaldt, (1962) citados por Takala, 1963., sobre los movimientos expresivos el avance ha sido muy lento.
[19] Wartegg fue miembro del partido Nazi NSDAP durante su estadía en la Universidad de Leipzig en los años 30.
Según Rovainen (2006) y Grønnerød (2011),[23] los Abstracts PsycInfo muestran un total de 88 estudios sobre el test Wartegg.
Justin Seitz (2003),[28] quien desarrolló un procedimiento de evaluación psicométrica del test utilizado en orientación profesional.
Esta operación arrojó considerable luz sobre el significado de las diferencias individuales y, por lo tanto, contribuyó apreciablemente a afinar el test como instrumento diagnóstico.
Otros estudios han hallado una concordancia muy alta (Interscorer Agreement) entre evaluadores expertos (k=0, 91).