Big Data #3

in #spanish9 years ago (edited)

Bienvenidos a la tercera entrega acerca de la big data, espero se suscriban, interactuen y le den Resteem. Gracias @javf1016

Primera entrega: https://steemit.com/spanish/@javf1016/big-data
Segunda entrega: https://steemit.com/spanish/@javf1016/big-data-2

II. CONTEXTO

Muchas empresas piensan ahorrar en el momento de implantar seguridad ya sea en proyectos, en el manejo de datos y prácticamente en todos los procesos, pero en un lapso de tiempo ese error puede causar que todo lo realizado se acabe de un momento a otro. La seguridad en la Big Data pasa por los empleados, sistemas y agentes externos.

La Conferencia Internacional de Autoridades de Protección de Datos y Privacidad hace un llamado a todas las partes que utilizan el Big Data para: [2]

• Respetar el principio de especificación de finalidad.

• Limitar la cantidad de información recolectada y almacenada a un nivel que sea necesario para el propósito legítimo que pretende.

• Obtener, cuando sea apropiado, el consentimiento válido del titular de los datos en relación con el uso de información personal para fines de análisis y de creación de perfiles.

• Ser transparentes acerca de qué información se recolecta, cómo se procesa, con qué propósito serán utilizados y si será transferida a terceros.

• Dar a las personas acceso apropiado a los datos que han sido recolectados sobre ellas y a la información y decisiones que se han tomado con esos datos.

• Ofrecer a las personas, cuando sea apropiado, acceso a la información sobre los insumos principales y los criterios para la toma de decisiones (algoritmos) que se han utilizado como base para el desarrollo del perfil.

• Llevar a cabo una evaluación de impacto en la privacidad, especialmente cuando el análisis del Big Data implica usos novedosos o inesperados de los datos personales.

• Desarrollar y utilizar tecnologías del Big Data de acuerdo con los principios de la Privacidad por Diseño.

• Considerar cuándo los datos anónimos mejorarán la protección de la privacidad. La anonimización puede ayudar a mitigar los riesgos para la privacidad asociados con el análisis del Big Data, pero sólo si la anonimización está diseñada y gestionada apropiadamente.

• Tener mucho cuidado, y actuar cumpliendo la legislación aplicable en materia de protección de datos, cuando se comparten o se publican conjuntos de datos con seudónimos o que pueden ser identificables indirectamente.

• Demostrar que las decisiones respecto al uso del Big Data son justas, transparentes y responsables. Relacionado con el uso de datos para fines de creación de perfiles, tanto éstos como los algoritmos en que están basados requieren una valoración continua.

A continuación observaremos algunos de los retos actuales que tiene la protección de la información recopilada en la Big Data, basándonos en las necesidades que fueron expuestas en la conferencia, las cuales afectan de forma directa el comportamiento actual y que se pueden mejorar en un futuro próximo, agrupándolas para una mejor comprensión.

Protección y Anonimización: El acceso a datos de comportamiento de una población, imágenes y videos, implica que debemos proteger la integridad de esta información, generar garantías en seguridad, para las personas, propiedades, sistemas y entonos implicados en la Big Data. El obtener datos de diferentes ambientes ya sea web, aplicaciones, IoT , implica que cada una tiene que desarrollar medidas que se adapten a sus necesidades específicas, para así no afectar el crecimiento de la información enlazada con la identidad de la fuente. En los últimos años varias empresas han sufrido filtración de datos o pérdida de los mismos, en la Fig. 3, observamos como en sectores (bancario, energético, financiero, telecomunicaciones, gubernamental), que se consideran seguros es donde más se refleja esta situación y así podríamos analizar cada uno de los sectores y nos encontramos que en la actualidad ninguno se encuentra a salvo de las mentes criminales.

Fig. 3. Información de datos perdidos o filtrados en los últimos años. [3]

Inversión y habilidad: Como se ha observado, la falta de inversión en las empresas en el área de seguridad es un factor muy importante, algo que debería ser de carácter obligatorio, no es tenido en cuenta en la mayoría de proyectos, ya sea por ahorrar costos o por falta de conocimiento, un enfoque corporativo se dirige a generar áreas especializadas en la seguridad en todo sentido, teniendo profesionales especializados en sus nóminas. No solo el potencial humano es necesario, el uso de herramientas enfocadas en las necesidades de seguridad también son muy útiles, pero se observa lo mismo, no hay inversión ni en la herramienta y en varios casos no hay inversión en la capacitación de sus empleados en dichas ayudas; No solo es adquirirlas sin aprovecharlas al máximo, todas y cada una de las herramientas en el mercado tienen sus ventajas y desventajas, eso todos lo saben, pero si no hay personal capacitado que las monitoree, que estén pendientes, no se llega a ningún lado, en esa ocasión y casos específicos, solo serían pérdidas para la empresa ya que se seguirían creando esos espacios para perdida, filtración, manejo erróneo de datos y lo que se buscaría al final, un análisis un estudio, todo se consideraría erróneo trayendo muchas más perdidas a futuro.

Datos erróneos: Algunas personas por tratar de ponerse seguras, en ocasiones esconden sus verdaderos datos, ingresan información valiosa de forma errónea, todo por tratar de ocultar su identidad en la red, pero no se dan cuenta que la red está avanzando rápidamente y cada ingreso a una página, cada vez que se ven fotos o videos, se recopila información acerca su comportamiento. Los estudios realizados en las empresas que se encuentran interesadas en mostrarle productos o mejorar la calidad de su contenido, se ven afectados por estos datos al momento de implantar la campaña que se ha venido desarrollando, generando pérdidas, hasta llegar al fin de una compañía.

La problemática de la seguridad se puede atender recolectando todos los datos, que sean pre-analizados basados en regalas que hayamos creado y así nos muestre un resultado para realizar una interpretación, llegando a lo que llamamos visualización de la seguridad, lo que en pocas palabras significa ver datos de forma diferente, gráficamente. Como se observa en la Fig. 4

Fig. 4 Descripción del proceso usado en la visualización de la seguridad

Contextualmente si en una empresa se realizan miles de conexiones a la base de datos cada segundo, todas pertenecientes a la red interna y de un momento a otro se presentan conexiones externas y consultan la base datos, se podría decir que estas conexiones quedaron camufladas entre las sesiones internas, pero la visualización de la seguridad nos permite en tiempo real observar todas las conexiones en formato gráfico, resaltando las conexiones sospechosas, un pequeño ejemplo que nos demuestra que ya un ataque camuflado no puede ser tan efectivo como antes. Ahora la pregunta que se genera al escuchar un ejemplo como el de la base de datos sería ¿Cómo alimentamos estas visualizaciones?, su respuesta no es tan complicada, como administradores de un sistema, usuarios, cada vez que realizamos operaciones sobre las diferentes aplicaciones, estas reflejan logs, además de apoyarnos en los dispositivos de red como el firewall , los routers y si no es suficiente tenemos detectores de intrusos, sniffers y podríamos llegar a usar las propiedades nativas del sistema operativo. Como se observa en la Fig. 5.

Fig. 5 Log del sistema operativo

Analizando todas las bitácoras generadas, haciendo los ajustes correspondientes obtendremos datos más fáciles de analizar en las visualizaciones de seguridad.
En la seguridad informática y el mundo de la Big Data no explota el potencial infinito en el análisis de los datos, hay un estigma que los ingenieros prefieren revisar datos directamente del sistema, pero con el volumen gigantesco con el que la Big Data avanza en una empresa, compañía, llega el momento en el cual se hace imposible realizar las operaciones clásicas para revisar los datos generados, además que no se podría realizar en tiempo real ya que por más eficientes que seamos nunca la capacidad humana nos daría para analizar y dar una interpretación basándonos en millones de registros por segundo.
Otros ejemplos puntuales que podrían ser detectados:

Detección de fraudes
Transacciones irregulares
Zero Day
Botnets

Simplemente adicionamos capas de análisis a los mecanismos internos de la compañía que están enfocados a detección y control, logrando capacidad para detección de amenazas en las operaciones normales. Actualmente las soluciones están basadas en sistemas centralizados, conociendo que el procesamiento se realiza de forma distribuida, la seguridad de los nodos, canales de comunicación, se convierte en algo fundamental a tratar.
Como suele suceder en la tecnología a medida en que se desarrolla, también se desarrollan ataques dirigidos, algo a tener en cuenta es que la seguridad viene mucho después, no es algo que se pueda controlar, un análisis de una tecnología antes de salir, no da la certeza de que nunca fallara o que será invulnerable.[4]

Glosario
Firewall, parte de un sistema o red, que se encarga de bloquear accesos no autorizados.
Router, dispositivo que permite conexión a nivel de red.
Sniffers, personas que escuchan todo lo que se mueve en una red.
Zero day, ataque a base de código malicioso, conociendo las vulnerabilidades desconocidas para la gente común.
Botnets, robots que se ejecutan automáticamente para controlar ordenadores o servidores y poder tener acceso a ellos de forma remota cuando se encuentran infectados.

Bibliografía
[3] Paul C. Zikopoulos; “Harness the Power of Big Data The IBM Big Data Platform”; Editorial: IBM Corporation; 2012.
[4] Accenture’s 2014 report; “Big Success with Big Data"; Documento WEB - PDF; [https://www.accenture.com/us-en/_acnmedia/Accenture/Conversion-Assets/DotCom/Documents/Global/PDF/Industries_14/Accenture-Big-Data-POV.pdf]

Coin Marketplace

STEEM 0.04
TRX 0.32
JST 0.076
BTC 63447.16
ETH 1663.05
USDT 1.00
SBD 0.42