¿No son los datos antiguos simplemente grandes datos con ropa nueva?
La innovación en IA está impulsando un crecimiento exponencial en el volumen y el valor de los datos. Más específicamente, la IA generativa finalmente está cumpliendo lo que prometió el big data: convertir la información en inteligencia procesable.
Pero aquí está el verdadero cambio: esos conocimientos no provienen sólo de los datos de ayer. Provienen de todo lo que una organización haya capturado. Cada byte podría contener el siguiente avance.
Es por eso que las empresas están reconsiderando los datos como un activo estratégico a largo plazo, no como algo que se puede descartar. Big data te brinda el “ahora”. Los datos históricos le dan el “por qué”. Juntos, alimentan la inteligencia.
Melyssa Banda es vicepresidenta sénior de almacenamiento y servicios perimetrales en Seagate
¿Por qué son tan importantes los datos antiguos (IA, ML) y dónde se encuentran principalmente? (¿cinta? ¿discos duros viejos? ¿papel?)
La IA no existe sin datos y los modelos más potentes se basan en patrones que abarcan el tiempo. Los datos históricos brindan contexto a la IA, transformando las predicciones en precisión y las ideas en innovación.
Piénselo de esta manera: la humanidad siempre ha conservado información, desde tablillas de arcilla en Mesopotamia hasta tarjetas perforadas para el censo de Estados Unidos. La diferencia hoy es que hay más en juego. La IA se nutre del volumen y la diversidad. Más datos significa mejores resultados, lo que brinda a las organizaciones una ventaja competitiva.
En cuanto a dónde residen esos datos, la gran mayoría de ellos, aproximadamente el 87% en implementaciones a gran escala, se almacena en discos duros. Las cargas de trabajo modernas de IA exigen discos duros escalables y de alta capacidad optimizados para un rendimiento y durabilidad sostenidos. Ya no se trata solo de velocidad, sino de manejar volúmenes masivos, garantizar la retención a largo plazo y hacerlo a escala.
Mantener datos antiguos conlleva un coste. ¿Qué puede pasar si las empresas deciden eliminar por completo los datos antiguos?
Eliminar datos no supone un ahorro de costes, sino que borra un valor potencial. Cada byte borrado es una oportunidad perdida para entrenar mejores modelos y generar conocimientos propios.
En industrias como las finanzas, la atención médica y la manufactura, los datos históricos son esenciales para la detección de anomalías, el mantenimiento predictivo y el análisis de tendencias. Sin ella, la IA se vuelve menos precisa, menos transparente y menos confiable.
También hay un aspecto de cumplimiento. Los reguladores exigen cada vez más auditabilidad en la toma de decisiones de IA. Si no puede rastrear sus datos de entrenamiento, no podrá demostrar su responsabilidad.
Borrar datos históricos es como borrar la memoria institucional. Se pierde la materia prima para la innovación. Una vez que desaparece, su valor desaparece.
Hace años, los clientes preguntaban: “¿Por qué almacenamos todos estos datos?” Hoy se preguntan: “¿Por qué lo eliminamos? Ayúdanos a almacenarlo”.
¿Qué soluciones pueden reducir el OPEX del almacenamiento de datos antiguos?
El objetivo no es sólo almacenar datos a bajo costo, sino almacenarlos de manera inteligente. Muchas organizaciones están cambiando a arquitecturas de almacenamiento por niveles, donde los datos a los que se accede con frecuencia se encuentran en sistemas de alto rendimiento, mientras que los datos más antiguos o a los que se accede menos se trasladan a niveles con costos optimizados.
Este enfoque garantiza que las empresas no paguen por un rendimiento que no necesitan. En resumen, almacenar de forma más inteligente, no sólo más barata.
En una declaración, usted y Seagate dijeron que las organizaciones deben repensar la gestión del ciclo de vida de los datos, pero con la tecnología avanzando tan rápido como lo hace actualmente, ¿es realmente posible?
La IA ha redefinido el valor de los datos, lo que significa que la gestión del ciclo de vida de los datos ya no puede significar archivarlos. Se trata de construir una infraestructura flexible y escalable que se adapte a medida que evolucionan las cargas de trabajo.
El viejo modelo de “almacenar y olvidar” ya no funciona. Piense en los datos como capital, son dinámicos y también lo es la tecnología que los impulsa. Las organizaciones que hoy en día reconsideran la gestión del ciclo de vida no sólo se mantienen al día, sino que también construyen una base que crece con ellas.















