Blog
-
Minifying HTML for GPT-4o: Remove all the HTML Tags - 02 Sep 2024
tl;dr; if you want to pass HTML data to GPT-4o, just strip out all the HTML and pass raw text, it’s cheaper and there is little to no performance degradation. Source code and demo available.
-
Using GPT-4o for web scraping - 28 Aug 2024
tl;dr; show me the demo and source code!
-
Don't make users read your docs - 23 Jul 2022
As an open-source maintainer, I always put effort into documenting all known edge cases so that users know how to fix problems. So, whenever users report incompatibilities, we highlight them in our documentation. Still, I realized this approach wasn’t working when users came to our Slack asking for help with problems we had already documented.
-
5 signs your Data Science workflow is broken - 16 Jul 2019
Developing reproducible data pipelines is hard, but before we even think about reproducibility your project has to meet some minimum standards. This post discusses some recurring bad practices when developing data pipelines and provides some advice to overcome them.
-
The case against data versioning - 27 Jun 2019
A recent technique to advocate for reproducibility in data analysis is data versioning, which means that some (or all) intermediate files generated by the pipeline are saved and tagged so we can come back to them at any moment. But I think data versioning is actually harmful for reproducibility.
-
Aplicando a una maestría en EE.UU. (II): Seleccionando programas - 07 Apr 2019
En esta segunda parte escribiré sobre qué parámetros tomar en cuenta para elegir los programas a los que aplicarás. Considera unos 10-15 programas en tu búsqueda, para finalmente aplicar a unos 6. Lo más importante es la calidad del programa pero considera que entre más prestigio tenga, más competitiva será la admisión, el resto de los aspectos que mencionaré no están en ningún orden particular, dependerá de ti cuál consideres más importante.
-
Aplicando a una maestría en EE.UU. (I): Planeando tu aplicación - 30 Mar 2019
Para inaugurar mi blog, he decidido escribir una serie de artículos para aquellos interesados en entrar a algún programa competitivo de maestría en EE.UU. en el área de STEM. Esta serie de artículos contendrá información que fui recopilando de diversas fuentes cuando me encontraba en el proceso, pero también cosas que tuve que aprender en el camino (y que me hubiera sido muy útil saber desde el principio).