El mito del dedo gordo

Es más o menos conocido que al diseñar para pantallas táctiles debemos cuidar las dimensiones de los elementos interactivos. Deben superar cierto tamaño para que puedan ser pulsados minimizando el número de errores.

Pekka Parhi, entre otros, investigó empíricamente mediante tests de usabilidad esta cuestión y determinó unos tamaños mínimos aconsejables que teóricamente toda persona que diseñe para interfaces táctiles debería conocer.

A partir de 5mm de tamaño, 1 de 30 taps (un 3%) fallara. A partir de 7mm es 1 de cada 100 (1%).Lo que no es tan conocido es porqué sucede esto.

La explicación habitual es que “tenemos los dedos gordos”. Según esta teoría, si alguien intenta pulsar repetidamente en un mismo objetivo visual, el punto de contacto entre el dedo y la pantalla será siempre distinto, con una distancia grande entre pulsaciones. Como si disparáramos a una pared con un arma automática sin estabilizar y viéramos los agujeros de bala muy dispersos pese a estar apuntando siempre en el mismo sitio.

Sin embargo, empíricamente se puede observar que esto no es cierto. Si se pulsa repetidamente en un mismo sitio las pulsaciones se concentran en un área mucho más pequeña de lo que la teoría del dedo gordo nos podría hacer pensar. Es decir, sí somos precisos, entendiendo precisión como el hecho de que pulsamos siempre en el mismo sitio. El problema, en todo caso, es que el sitio en el que realmente pulsamos y el que percibimos o creemos estar pulsando pueden ser distintos. Volviendo a la metáfora del arma, es como si realmente los agujeros no estuvieran dispersos entre sí, pero sí puede ser que nunca toquemos al blanco.

Esto es observable en cualquier test de usabilidad: vemos participantes que no tienen ningún problema en pulsar en zonas mucho más pequeñas de lo recomendado, mientras que otros son incapaces de hacerlo aunque pulsen repetidamente. Y no, unos no tienen los dedos más gordos que los demás. Simplemente su pulsación tiene un offset o desvío fijo: visualmente creen estar pulsando en un sitio, pero pulsan siempre algo más abajo o más arriba.

Un dedo siempre pulsa fuera de su objetivo, pero todas las pulsaciones son muy cercanas

Christian Holz y Patrick Baudisch han propuesto el “Generalized Perceived Input Point Model” que explica estas observaciones con diversas variables, entre ellas el ángulo de contacto y el modelo mental de cada usuario, es decir, cómo entiende cada persona el hecho de “tocar”.

Los autores del modelo comentan que el problema, pues, es un caso de hardware no adaptándose al modelo mental del usuario y no tanto de una limitación inherente de nuestros mecanismos físicos para tocar.

Drag me to hell

Drag, slide, swipe, flick, fling, pan… Tenemos un problema: ni los fabricantes, ni las guías de estilo, ni los expertos se ponen de acuerdo en qué significan exactamente estas palabras. Y es complicado hablar de diseño de interfaces en pantallas táctiles si ni siquiera tenemos un vocabulario común.

Un ejemplo: Jakob Nielsen, en su último libro sobre usabilidad en móviles, afirma que “The gestures that most people use naturally on the iPad are tapping and dragging”. En iOS se define un drag como “To scroll or pan (that is, move side to side)” o “To drag an element” (brillante). ¿Pero es en Android el drag igual de “natural” que en iOS? Todo depende de qué entendamos por drag, ya que en las guías de estilo de Android se define como “Long press, move, lift”. Estamos jodidos: el long press es uno de los gestos de un sólo dedo (junto al doble tap) más complicados de descubrir por los usuarios.

También es habitual confundir un drag con un flick (“To scroll or pan quickly” según Apple) cuando tienen poco que ver, al menos en cuanto a su usabilidad se refiere: el flick no sólo es menos descubrible sino que también es más complicado en su ejecución, ya que un componente de la interacción que el drag ignora, la velocidad de desplazamiento del dedo, aquí sí es relevante.

Incluso palabras como swipe, que significan más o menos lo mismo para Apple y Google, entran en conflicto cuando empezamos a trabajar en Windows 8, donde un swipe se define ambiguamente como “One or more fingers touch the screen and move a short distance in the same direction”.