Damavis Blog
Nueva entrada de nuestro Data Engineer Victor Prats, sobre las pipelines de agregación en MongoDB
Los pipelines de agregación de MongoDB son potentes y el método preferido para agregar datos. Con la optimización incorporada, los pipelines facilitan la computación de los resultados y sólo necesitan que el usuario sea consciente de unas pocas optimizaciones claramente mencionadas en su documentación.
MongoDB es una base de datos de open source NOSQL orientada a documentos, lo que significa que los datos no tienen que seguir necesariamente un esquema determinado. Esto hace que MongoDB sea un candidato ideal como base de datos para cargas de trabajo de big data, ya que garantiza un mejor rendimiento y se deshace parcialmente de las preocupaciones creadas por los esquemas forzados o las costosas operaciones ALTER TABLE.
¿Cómo consultamos MongoDB?
Cómo realizar proyectos Big Data y sobrevivir a ello
¿Son los proyectos Big Data caros? Existe una creencia infundada en este tema, que limita a muchas empresas a día de hoy.
Es típico escuchar frases como «con los datos agregados basta» o «con tener los datos resumidos de cada día o de cada quincena, lo tenemos controlado» pero hay que tener en cuenta, que el detalle de la información es muy valiosa y que la conversión de ésta a la cantidad de proyectos y estrategias que la compañía puede generar, debe considerarse una inversión y no un gasto
Una inversión no es necesariamente cara, si ésta se adapta a las necesidades de la empresa
En Damavis tenemos proyectos en los que almacenamos teras de información diarios, y a nuestros clientes no les está suponiendo ningún «gasto» que no puedan permitirse frente a los beneficios y ventajas que obtienen.
Siempre y cuando seas consciente del poder que te dan los datos que generas si sabes escucharlos, tu proyecto en Big Data será un éxito
Estamos seguros de que podemos ayudarte a sacarle partido a los datos en tu empresa
Visto en Redes
Durante la semana compartimos las noticias más interesantes del mundo del big data e inteligencia artificial, en nuestras redes sociales: Twitter, Facebook, Instagram y Linkedin
Algorithm Selection
Esta guía explica la selección de algoritmos para Machine Learning. Se presentan dos potentes mecanismos de algoritmos modernos: la regularización y los conjuntos. Estos mecanismos «solucionan» algunos grandes fallos de los métodos más antiguos, por eso son tan populares.
Música en Python
Procesamiento de señales en términos musicales y visualización de la teoría musical.
Con unas pocas líneas de código usando Numpy y Scipy, se puede analizar fácilmente el sonido incluso si no se tiene un oído de músico entrenado o una afinación perfecta
Puedes leer el artículo completo en el artículo Music in Python
Tendencias 2021 en Data Science
La ciencia de los datos dará cada vez más prioridad a la integración de todo el espectro de datos y métodos de IA, incluidos los aspectos de su base estadística y de conocimientos, en los despliegues diarios en toda la empresa. La utilización de toda la variedad de técnicas e información a disposición de los científicos de datos mejorará sustancialmente la generación de características, la preparación de datos y la capacidad de explicación.
Tienes el artículo completo en 2021 Trends in Data Science: The Entire AI Spectrum
Y hasta aquí, el resumen de la semana 12 de este 2021 ¡Nos vemos en redes!
Att, Damavis