La marca BOM en UTF-8

Este artículo es un pequeño truquillo basado en mi experiencia en situaciones concretas. Veréis que, desde el punto de vista de la programación es algo muy simple que, si lo piensas un segundo, seguramente ya conoces. Sin embargo, para aquellos que se lo encuentran por primera vez puede suponer un pequeño quebradero de cabeza. Te cuento. Todos, a día de hoy, trabajamos con la codificación UTF-8 en nuestros archivos. Todos nuestros scripts están grabados con esta codificación. Y también la damos (y la exigimos) cuando tenemos que intercambiar datos con servicios o aplicaciones de otros desarrolladores. Esta codificación abarca todo el código Unicode y evita que tengamos conflictos cuando empleamos caracteres de alfabetos locales o, incluso, guarismos que no pertenecen a ninguna alfabetización específica. Cuando digo que “todos usamos UTF-8” estoy generalizando un poco. En determinados proyectos de gran envergadura, con recursos y finalidades muy específicos, se emplean otras codificaciones (y si no, que le pregunten a IBM, que de eso saben un rato) pero, desde luego, en el mundillo del desarrollo web, o de aplicaciones de escritorio, UTF-8 es, sin duda, el estándar imperante. Sin embargo, hay dos modos de grabar contenidos o documentos en UTF-8. Con y sin …

Seguir leyendo