Cooperativa de datos + IA para inversión a largo plazo +Blumberg-hacendado

DrAlpha
ForoCoches: Usuario
#1
Actualización — Febrero 2025


Qué hay montado
Un pipeline que baja filings de la SEC (10-K, 10-Q), los limpia y los convierte en markdowns estructurados para LLMs. Tres scripts encadenados: descarga → limpieza → curación. Cada paso es independiente e idempotente. También descargamos los company facts: todos los datos financieros en XBRL (ingresos, beneficio neto, activos, etc.) en JSON por empresa.
Qué nos falta?
Newsletters, foros, reddit, etc. de calidad alta -> Un agente las procesa y convierte en markdowns. La estructura ya soporta múltiples fuentes. Cada una su script de ingesta, mismo formato de salida. Cuando tengamos 3-4 fuentes, generar un memo de inversión es pasarle los markdowns relevantes al LLM con un template.
Colaborar (Si te quieres unir: Mándame MP con tu usuario de TG)
  • Fuentes: si tenéis acceso a newsletters o APIs de datos, se integran
  • Costes: curar un 10-K cuesta ~$0.35. Repartido entre varios es viable a escala
  • Revisión: verificar que lo que saca el LLM tiene sentido (la parte humana)
  • Código: Python + SQLite
DrAlpha
ForoCoches: Usuario
#2
Notas:

Tras primera exploración de valores pondremos lista para coordinar la recogida de datos para adjuntar al agente ANALISTA


Lista de los que han currado algo: @DrAlpha @John Nash
DrAlpha
ForoCoches: Usuario
#3
Reservado
albert0t0
No me huvico muy vien aki
#4
Cita de DrAlpha
¿Nadie quiere compartir datos de calidad?


Por como lo has planteado si no lo he entendido mal, quieres montarte el bloomberg de la pizza demigrante siendo tu el dueño y con el trabajo y datos de terceros gratis, es correcto? asi normal que nadie quiera aportar
Alexeme
ForoCoches: Usuario
#5
Cuéntame más
DrAlpha
ForoCoches: Usuario
#6
Cita de albert0t0
Por como lo has planteado si no lo he entendido mal, quieres montarte el bloomberg de la pizza demigrante siendo tu el dueño y con el trabajo y datos de terceros gratis, es correcto? asi normal que nadie quiera aportar
Pues lo has entendido mal porque es todo lo contrario.

Aquí hay peña que está abriendo grupos de mierda cobrando y yo planteo justo lo contrario y por supuesto siendo todos iguales.
DrAlpha
ForoCoches: Usuario
#7
Cita de Alexeme
Cuéntame más
Yo me estoy intentando currar muchas cosas. Datos, informes, etc. Y lo comparto con el foro y con quien quiera encantado. Igualmente hay muchos hilos por ahí aportando mucho valor, pero también hay muchísimo ruido para encontrarlo. Lo que planteo es organizarnos en sacar oro de los datos y partiendo de algo sencillo podría escalar hasta algo más.
albert0t0
No me huvico muy vien aki
#8
Cita de DrAlpha
Pues lo has entendido mal porque es todo lo contrario.

Aquí hay peña que está abriendo grupos de mierda cobrando y yo planteo justo lo contrario y por supuesto siendo todos iguales.


Entonces te diría que visto que nadie escribió, lo expliques de otra forma no sea que haya más gente que lo hubiera entendido mal como yo
DrAlpha
ForoCoches: Usuario
#9
He recibido algún MP, que he respondido. Hemos empezado a trabajar en algo aunque está un poco inmaduro. En tener tiempo actualizo el hilo y si hay más interesados me pueden mandar MP.
ArtiOne
ForoCoches: Miembro
#10
Sitio
velajrande
lo mejor está por llegar
#11
Interesa, hay que hablar
DrAlpha
ForoCoches: Usuario
#12
Cita de artione
sitio
mp
Empollón
ForoCoches: Usuario
#13
Me interesa!

Hace años , por probar, construí lo siguiente:
  • Descarga automática de todos los informes de la CNMV cuando las empresas presentaban resultados (web scrapping + programas en python)
  • Ingesta de los datos financieros (procesaba los formatos .xbrl) que volcaba a BD propia
  • Análisis de los datos (construcción de ratios, etc...)
... pero con el Covid dejé de hacerlo.

Este año quiero retomarlo y acabo de ver tu post.
3penes
ForoCoches: Miembro
#14
sitio, manda MP.

Seria ideal crear grupo telegram
DrAlpha
ForoCoches: Usuario
#15
Cita de Empollón
Me interesa!

Hace años , por probar, construí lo siguiente:
  • Descarga automática de todos los informes de la CNMV cuando las empresas presentaban resultados (web scrapping + programas en python)
  • Ingesta de los datos financieros (procesaba los formatos .xbrl) que volcaba a BD propia
  • Análisis de los datos (construcción de ratios, etc...)
... pero con el Covid dejé de hacerlo.

Este año quiero retomarlo y acabo de ver tu post.
He estado haciendo experimentos de scraping y la película ha cambiado bastante. Antes no habían las defensas de ahora. Por eso estaba mirando opciones de sacar datos con APIs.
Black-Hole
ForoNaves: foronauta
#16
Shur, si me das info yo quizas pueda colaborar. La verdad que tiempo no tengo mucho (tengo trabajo, hijos y otros projectos personales), pero quizas alguna vez pueda hacer algo y, ademas, puedo ayudar y dar ideas.
Trabajo en temas de evaluacion y monitoreo de agentes de IA de mi empresa.
VaeNKiel
ForoCoches: Miembro
#17
Interesa
roverico
ForoCoches: Usuario
#18
Idem, interesa! MP porfa! Feliz y Próspero 2026!
DrAlpha
ForoCoches: Usuario
#19
Cita de roverico
Idem, interesa! MP porfa! Feliz y Próspero 2026!
Feliz 2026. A ver si le damos un empujoncito.
velajrande
lo mejor está por llegar
#20
Cita de DrAlpha
Seguimos avanzando: Listo el primer esquema

Idea: usar IA para buscar y ordenar información, y humanos para decidir y verificar lo importante.
Pipeline simple
  1. Humano define el objetivo
  • Qué activo miramos, para qué (comprar/short/watch), y con qué horizonte.
  1. IA clasifica el activo
  • Decide si es acción, cripto, macro, crédito, etc., y qué “módulo” usar.
  1. IA (agéntica) recopila fuentes y saca “claims”
  • Con Gemini Deep Research y/o ChatGPT Deep Research:
    • junta documentos (fuentes),
    • extrae afirmaciones importantes (“claims”),
    • marca qué está bien apoyado y qué es dudoso.
  1. Humano asegura las fuentes buenas
  • Comprueba que estén los documentos “serios” (informes oficiales, filings, transcripciones), y quita basura.
  1. IA (agéntica) escribe el memo completo
  • Genera un documento único con:
    • resumen,
    • narrativa/tesis,
    • datos clave,
    • riesgos,
    • catalizadores,
    • escenarios (bear/base/bull),
    • y enlaces a fuentes.
  1. IA (no agéntica) lo limpia y lo estandariza
  • Quita repetición, deja el memo comparable con otros, sin inventar nada.
  1. IA + humano hacen auditoría (red-team)
  • La IA busca errores y saltos lógicos.
  • Un humano verifica 3–5 puntos críticos en las fuentes originales.
  1. Humanos deciden
  • Con el memo auditado, se decide: entrar, esperar, o descartar.
  • Se anotan señales de salida (qué dato nos haría cambiar de idea).
  1. Actualizaciones
  • Cada vez que salgan nuevos datos, la IA actualiza por “diff” (qué cambió) sin rehacer todo.
Clave:
  • IA agéntica = buscar/leer muchas fuentes.
  • IA normal = limpiar, ordenar, comparar.
  • Humanos = elegir foco, decidir, y verificar lo que sostiene la tesis.
Miembros (mandadme MP los que no estéis en TG): @DrAlpha @ArtiOne @velajrande @Empollón @3penes @Black-Hole @VaeNKiel @roverico
Se precisa apis de pago para todo eso.
Alexeme
ForoCoches: Usuario
#21
Interesa
DrAlpha
ForoCoches: Usuario
#22
Cita de velajrande
Se precisa apis de pago para todo eso.
Apis de modelos y de datos integrado sería el objetivo final ideal. La idea es empezar manual e ir refinando. Esto es una fumada que habrá que corregir bastante, cada output bien leído para ir revisando los prompts, porque si no se va acumulando basura. A poco que funcione ya mejora en mucho la toma de decisiones típica que al menos yo tenía
John Nash
ForoCoches: Usuario
#23
Interesante. Me apunto si es posible
Basuraadsl
Viviendo que no es poco
#24
Parece interesante. Mp si es posible.
Black-Hole
ForoNaves: foronauta
#25
Justo me ha salido esto hoy en Reddit:

https://app.deepvalue.tech/


https://www.reddit.com/r/ClaudeAI/co...h_claude_code/


Todavia no lo he probado.
DrAlpha
ForoCoches: Usuario
#26
Cita de Black-Hole
Justo me ha salido esto hoy en Reddit:

https://app.deepvalue.tech/


https://www.reddit.com/r/ClaudeAI/co...h_claude_code/


Todavia no lo he probado.
Le he estado echando un vistazo y parece una caja negra. El tío habrá montado su pipeline con la API de Claude Code, pero pone: search for the fillings. Precisamente nosotros estamos dándole al modelo los fillings para que no los alucine buscando. Puede haber prompt poisoning (que alguien maliciosamente meta desinformación en alguna web), que se encuentren problemas para scrapear y alucinen datos... Además que no controlas nada del proceso. Nosotros podríamos acabar haciendo una herramienta así mucho mejor.
Eden26
ForoCoches: Usuario
#27
Lo veo interersante
DrAlpha
ForoCoches: Usuario
#28
Up con las novedades. Vamos a compartir un drive con la base de datos, pero lo que es la estructura ejecutable irá en un github (lo publico aquí en tenerlo subido)
rocualete
ForoCoches: Miembro
#29
Pregunta desde la barra de bar, yfinance no serviría?
DrAlpha
ForoCoches: Usuario
#30
Cita de rocualete
Pregunta desde la barra de bar, yfinance no serviría?
yfinance no tiene API, pero igual se puede scrapear algo.
← A InverForo