OpenRefine – Calidad de los datos de nuestro repositorio y el MEC

¿De cuántas formas diferentes aparece el MEC en nuestros repositorios?

Si aparece menos de 3 ya nos podemos dar por satisfechos.
El MEC, actual Ministerio de Educación, Cultura y Deporte, ha ido cambiando sucesivamente de nombre pero acostumbramos a referirnos a él como MEC o Ministerio de Educación. Este hecho ha ocasionado que en una búsqueda simple nos podamos encontrar con muchas variantes

  • MEC
  • MECD
  • MINISTERIO DE EDUCACIÓN (MEC)
  • MINISTERIO DE EDUCACIÓN
  • MINISTRY OF EDUCATION
  • Ministerio de educación
  • Ministerio de Educación, Cultura y Deporte

en metadatos como: título, nombre de objeto, subdivisión nominal, palabras claves, notas, organización.
Lo mismo también acostumbra a pasar con otros organismos, unidades/oficinas productoras, estudios, facultades,…

Estas situaciones hacen bajar mucho la calidad de nuestros datos. Y ocasionan muchos problemas/errores en las búsquedas, informes y estadísticas.

Delante de esta situación es conveniente planificar periódicamente tareas de control de calidad de datos que nos permitan analizar y corregir los errores e inconsistencias que tengamos en el repositorio. Esta tarea se hace imprescindible antes de afrontar un cambio de plataforma, migración o update.

Afortunadamente existen herramientas que nos ayudan a descubrir estos errores e inconsistencias. Desde

  • el socorrido MS-Excel o Google Drive;
  • a herramientas que pueden hacer cambio directamente contra el repositorio;
  • a herramientas de tipo ETL (Extract, Transform and Load – «extraer, transformar y cargar» es el proceso que permite mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio).

Hoy os presentamos la utilidad opensource gratuita OpenRefine  (antes conocido como Google Refine) “una poderosa herramienta para trabajar con datos desordenados: limpiarlo; Transformándolo de un formato a otro; Y ampliarlo con servicios web y datos externos.” Podéis utilizarla como ETL o incorporarlo al sistema de gestión documental como un webservice.

Para que podáis ver cómo funciona OpenRefine os dejamos el siguiente video, que pese a estar en inglés, es muy fácil de seguir

Video #01 – Explore Data (OpenRefine can help you explore large data sets with ease)

En la web de OpenRefine podéis más vídeos, información e instrucciones para instalar y configurarlo.

 

Diccionario de términos y conceptos de la Administración Electrónica

El Portal de la Administración electrónica (PAe) ha publicado el “Diccionario de términos y conceptos de la Administración Electrónica

2017-06-14 13_08_58-Diccionario de términos y conceptos de la Administración Electrónica - Adobe Acr

El Diccionario ofrece 2.329 términos principales, con definiciones mayormente sobre la base de fuentes originales, junto con referencias cruzadas entre ello.

Se recogen términos del ámbito del derecho Administrativo regulado por las leyes 39/2015 (LPAC) y 40/2015 (LRJ) o los RD 3/2010 (ENS), 4/32010 (ENI) y de todo lo electrónico o derivado de su uso: Firma Electrónica, Protección de datos, Datos abiertos, Transparencia y Buen Gobierno, Compras públicas, Subastas, Administración de Justicia con uso de técnicas electrónicas, Servicios de la Sociedad de la información, Accesibilidad, Confianza digital, factura electrónica, etc. Se tratan también incluso términos y conceptos aun no regulados de interés en la materia tales como la participación ciudadana, las Redes Sociales, el Hacking y los CERT, el voto, la firma biométrica, etc. Y por supuesto normas técnicas, servicios e Instituciones.

El diccionario está disponible en pdf y epub – muy útil para consultarlo desde el móvil o table en casos de una urgencia semántica.

Más información

  • Pae – Diccionario de términos y conceptos de la Administración Electrónica [web]

La Comisión Europea programa webseminars para dar a conocer el Estándar Europeo de Facturación que se publicará en 2017

La Comisión Europea, a través del programa CEF (Connecting Europe Facility) ha programado una serie de webseminars gratuitos para dar a conocer el Estándar Europeo de Facturación Electrónica (CEN/TC 434 – Electronic Invoicing).

En ellos se hará un completo estudio tanto de la Directiva 2014/55/UE del Parlamento Europeo y del Consejo, de 16 de abril de 2014 , relativa a la facturación electrónica en la contratación pública y  como del Estándar Europeo de Facturación electrónica. Desde sus origines y antecedentes (proyectos PEPPOL y eSENS); pasando por la sintaxis,  el esquema de metadatos; “conversión y mapeo”; interoperabilidad; infraestructura necesaria;…

Recordatorio normativo (extracto de la directiva)

 

2017-06-07 16_09_43-Media library - CEF Digital - CEF Digital

Los Estados miembros velarán por que los poderes y entidades adjudicadores reciban y traten las facturas electrónicas que cumplan la norma europea sobre facturación electrónica cuya referencia haya sido publicada (…) Art. 7

Los Estados miembros adoptarán, publicarán y aplicarán las disposiciones legales, reglamentarias y administrativas necesarias para dar cumplimiento a la presente Directiva a más tardar el 27 de noviembre de 2018. (…) Art.11.1

Los Estados miembros podrán aplazar la aplicación hasta 30 meses después de la publicación de la referencia de la norma europea sobre facturación electrónica en el Diario Oficial de la Unión Europea. Art.11.2

 

Los nueve webseminars, están programados entre mayo 2017 y febrero 2018, se podrán seguir tanto en online como offline

Calendario de los webseminars

  •  #1 CEF eInvoicing – What’s in it for you?  31 May 2017 10:00 – 11:30 (CET)
  • #2 – Funding and grants for eInvoicing – 5 July 2017 10:00 – 11:30 (CET)
  • #3 – The European standard (eInvoicing Directive) and its content – 11 September 2017 10:00 – 11:30 (CET)
  • #4 – Infrastructure based on the eDelivery DSI architecture – September 2017 (date tbc)
  • #5 – eInvoicing from a user’s perspective (incl. ordering & payments) – October 2017 (date tbc)
  • #6 -Examples of Early Adopters of large scale eInvoicing – November 2017 (date tbc)
  • #7 – Basic XML using examples from the EN-syntaxes plus mapping & conversion
    December 2017 (date tbc)
  • #8 – XML validation mechanisms  – January 2018 (date tbc)
  • #9 In-depth OASIS UBL 2.1 & UN/CEFACT CII – February 2018 (date tbc)

 

Os podéis inscribir a los webseminars, dándoos de alta en el portal de la Unión Europea en la web de CEF Digital:

Nota: El Estándar Europeo de Facturación Electrónica, conocido también como eInvoicing, como cualquier otro estándar es de pago y se comercializa a través de las “los canales habituales”.

Más información

Ecos de Sociedad Archivística – Noruega abrirá una bóveda para preservar la información mundial 1000 años

Noruega abrirá próximamente el World Arctic Archive, una bóveda para preservar la información mundial 1000 años

piql

El World Arctic Archive está dirigido por Piql, una compañía con sede en la ciudad noruega de Drammen con sólo 17 empleados.

Piql ha desarrollado una tecnología que permite que las antiguas películas fotosensibles puedan almacenar grandes cantidades de datos en múltiples capas en forma analógica. La película está diseñada para soportar mucho desgaste.

Katrine Loen Thomsen de Piql cree que podrán guardar los datos durante un total de 1.000 años. Para hacerlo posible los datos son transformados en códigos QR y se guardan en grandes películas.

El World Arctic Archive comparte la misma montaña que el Banco Mundial de Semillas de Svalbard (también llamado Bóveda Global de Semillas)

Más información:

PANIC: Nos han cifrado todos los expedientes !!!

Las ideas y opiniones contenidas en  este artículo son de responsabilidad de su  autor, sin que reflejen, necesariamente, el pensamiento de CAU.

panic-cartoon-1024x614

La culpa es de George Clooney

Viernes. 12 de la mañana. Llega un correo informando que “George Clooney ha muerto en un accidente de tráfico”.

Al abrirlo vemos que contiene el texto de la noticia y un enlace donde poder, en primerísima exclusiva, las impactantes  fotos. La primera foto se carga rápidamente: un Ferrari 250 GTO aparece destrozado después de haber sufrido un accidente de tráfico. Las siguientes fotos cada vez tardan más en cargarse y el PC va cada vez más lento.

Algo parece que no va bien….

pantallazo rescate

 

El ataque que sufrió la empresa Telefónica el pasado 12 de mayo mediante el Ransomware WannaCry ha llevado  a este tipo de incidentes de seguridad a la primera página de la actualidad [prensa nacional aquí, aquí; prensa internacional aquí, aquí].

Lo que pasó en Telefónica no fue muy distinto de la historia del inicio el post. Según parece ser, en el caso de Telefónica el correo hacía referencia a una factura pendiente de pago.

¿Puede un ransomware cifrarnos los expedientes electrónicos del archivo electrónico?

Dependerá mucho de la implantación que tengamos del ECM (Enterprise Content Management). Y más concretamente de la estrategia de acceso y almacenamiento de los contenidos.

Hemos de tener en cuenta que el objetivo principal de un ransomware es bloquear el acceso a los ficheros de la víctima. La forma más conocida de operar es cifrar  los ficheros para posteriormente pedir un rescate en bitcoints.

Es importante tener en cuenta que los ransomware actuales no solamente cifran los ficheros del disco duro sino que también aquellos que  están en de las unidades de red a los que el usuario tenga acceso.  Debido a este último factor, tener acceso directo los documentos de archivo mediante una unidad de red representa un serio factor de riesgo delante de este tipo de amenazas. También en el caso de utilizar  Sistemas de Competición y Sincronización de Ficheros (EFSS – Electronic File Sync and Share) como son Box, Dropbox, Huddle, Syncplicity,..

A mí no me pasará porque no le intereso a nadie.. Vs. Yo estoy “superprotegido”

Todos somos potenciales víctimas. Los recates suelen entre  300 dólares (275 euros) en bitcoins a

  • Al Hospital Hollywood de California le pidieron un rescate de 3,5 millones de dólares. Finalmente solo pagó $ 17,000 para recuperar el acceso a sus sistemas vitales [web en inglés].
  • La Universidad de Calgary (Canadá) paga 20,000$  por recuperar emails y ficheros cifrados  [web en ingles]

Y en el caso de sufrir un ataque…

En caso de sufrir un ataque, en España dispone de una excelente red de centros de respuesta a incidente (CERT en inglés) donde nos pueden ayudar:

Algunos consejos

  •  ¿Pagar o no Pagar? A veces se paga y te envían la clave. A veces no responden. A veces te piden más dinero.
  • Regla general: Siempre es mejor poner en uso los ficheros recuperados de una copia de seguridad que los que podamos haber descifrado. Pese que actualmente los ransomware utilizan programas estándar de cifrado no podemos asegurar que lo hagan en el futuro.
  • El sistema atacado debe ser puesto en cuarentena hasta que el departamento TIC autorice su uso y se proceda a la recuperación de datos. Nunca actuar por nuestra cuenta.
  • Importante: Que abramos un fichero y  veamos que su contenido es el mismo que antes del ataque no quiere decir que el fichero no se haya modificado o contengan un “huevo kinder”. Es recomendable hacer periódicamente un listado de todos los ficheros del repositorio que incluya varios resumen hash. Este sencillo mecanismo permite detectar modificaciones o errores en los ficheros.

Cifrar vs. Encriptar ¿Términos equivalentes?

Con frecuencia a los procesos de cifrado y descifrado se les denomina encriptado y desencriptado, ambos anglicismos de los términos ingleses encrypt y decrypt. La Real Academia Española recogió esa acepción en la edición de su diccionario de 2014. (Fuente Wikipedia Cifrado )

Sea como sea, para mí:
Cifrar es utilizar un método que permite aumentar la seguridad de un mensaje o de un archivo mediante la codificación del contenido, de manera que sólo pueda leerlo la persona que cuente con la clave de cifrado adecuada para descodificarlo.
Encriptar es  meter algo o a alguien en una cripta.

Más información

  • Para aquellos curiosos que quieran ver paso a paso  como funciona un ramsonware, os dejo un interesante artículo en inglés.
  • Ransomware, una amenaza renacida con un modelo de negocios lucrativo [web]

Zacarías Sánchez
Archivero por Ósmosis. CISA. CISM.

Archives and Architecture – The Presidential Archive of Korea

Hoy empezamos la sección  Archives and Architecture en la cual pretendemos recoger  ejemplos de arquitectura contemporánea dedicados, en su totalidad o parcialmente, a un archivo.

Esta sección nace a raíz de las preguntas sobre las fotos que han encabezado nuestro Facebook  con el sello “Archive Inside”.  Esperamos vuestra colaboración en nuestro mail.

Iniciamos la sección el Archivo Presidencial de Corea.

AxO-AAA-The_Presidential_Archive_of_Korea

From the architect. Designed by Samoo in collaboration with Kunwon & ABLine, the new cultural facility is designed to be fully integrated into the surrounding natures and exhibit historical records of Korea’s presidents. Based on the government’s masterplan to create a new administrative city approximately 130km south of Seoul, the Presidential Archive was developed as one of the most prominent infrastructure for the new Sejong city.

Fuente: [web – inglés]