Introduccion al Quant Research

Una estrategia quant es una estrategia sistemática, condicionada por los datos y el modelo, el cual está programado para generar decisiones de inversión. El principal pilar dentro del quant research, es el método científico.

Introduccion al Quant Research

El procedimiento para realizar descubrimientos dentro del campo de las finanzas cuantitativas, es denominado como quant research.

Una estrategia quant es una estrategia sistemática, condicionada por los datos y el modelo, el cual está programado para generar decisiones de inversión.

El principal pilar dentro del quant research, es el método científico.

¿Qué es el método científico?

El método científico es un método que nos permite categorizar las relaciones de los fenómenos dentro de una forma objetiva, y replicadle sobre el fenómeno observado.

El método científico se basa sobre la formulación de una hipótesis y una evolución empírica sobre la tesis, utilizando unos requisitos altos de rigor analítico, y utilizando análisis de sensibilidad para "manipular" las hipótesis y el contexto en que la premisa fue formulada, para obtener mayor rigor en las conclusiones.

Correlación no implica causalidad.


Lo cual nos quiere explicar, que una supuesta asociación entre variables, no tiene por qué causar directamente una reacción

La causalidad es un concepto extra-estadístico. Viene dado por la naturaleza del fenómeno, y no por eventos matemáticos.

Fases del método científico dentro del quant research.

  • Fase 1: Esta fase denominada "pehomenological step" es la base de observación. La búsqueda de patrones recurrentes, que inicialmente pueden ser asociadas a eventos o fenómenos, sin ir más allá. El objetivo principal es encontrar una situación inicial de nuestro "problema". Por ejemplo, queremos investigar si, una subida en el precio del activo A, afecta al activo B. Y la forma tradicional ha sido mediante la inducción lógica, pero actualmente se utiliza una amplia variedad de métodos.
  • Fase 2: En este punto, realizamos hipótesis en función a las observaciones realizadas. Se propone un mecanismo causal observable como responsable del fenómeno.
  • Fase 3: En esta fase denominada falsificación, el objetivo es falsificar cada componente que se haya catalogado como parte del mecanismo causal. Deduce las implicaciones clave de la teoría, como por ejemplo, es imposible que la hipótesis sea verdadera, y las implicaciones falsas. El objetivo principal de esta fase 3 del procedimiento es validar que las implicaciones asumidas son incorrectas, mediante la deducción lógica, entre muchos otros métodos. Se necesita gente con experiencia y creatividad en esta fase.

Experimentos más usados

Hay tres tipos de experimentos utilizados.

  • Experimentos Intervenciones: En un entorno controlado, se observa el efecto de Y sobre el valor de X mientras se mantienen constantes el resto de variables. Además de utilizar técnicas como el RCT (Random controlled trial) para validar las pruebas.
  • Experimentos Naturales: Se clasifica en grupos de control determinados de forma aleatoria. O sobre universos amplios de activos. El objetivo reside en una validación lo más sólida posible. Se utilizan los métodos de Estudios Cruzados (COS) o Diferencia de Diferencias (DID)
  • Intervenciones Simuladas: Cualquier metodología que utilice series sintéticas

Quant Factors or Quant Models

All models are wrong, some models are useful

Los modelos son idealizaciones sobre el mundo real, intentar reducir la complejidad del día a unos cuantos componentes matematizables, que puedan capturar Alpha de alguna manera. Los modelos pretenden describir las cualidades sobre las cuales se pretende extraer rentabilidad.

Es importante apuntar que no todas las dinámicas de mercado son modelizadles, y que en un modelo, no están incluidos todos los mecanismos conocidos, sino que se intenta aislar un componente en concreto.

Dentro de todos los modelos, no existe una homogeneidad, entre ellos difieren en su motivación para operar, la frecuencia operativa, la información utilizada para operar, los mercados operados, los periodos de holding, etc.

  • Estrategias Multifactor: Invierten en activos basados en múltiples factores. Su objetivo principal es adelantarse a las decisiones del mercado. Estas estrategias radican su Alpha, en su capacidad de cómputo, y con las nuevas GPU Nvidia, los niveles de procesamiento ha llegado a niveles inasumibles para el usuario retail.
  • Estrategias de Asset Allocation: Estrategias con decisiones basadas en allocation (% total de activos sobre gestión() en sectores, países, factores, regímenes de mercado, timigins etc. y su ventaja radica en su capacidad de switching entre escenarios riskon y riskoff.
  • Estrategias de Stock-Specific. Estrategias basadas en la información de un único activo, y van dirigidas únicamente a ese activo.
  • Estrategias Single Factor. Estrategia basada en reglas o condiciones, donde utiliza técnicas para obtener Alpha de los activos, usualmente vía premium.
  • Estrategias de Event Management: Toda estrategia que genere Alpha sobre eventos previstos, como elecciones de presidentes americanos, guerras, o cualquier evento no previsto, que genera un desajuste en el mercado y habilita la posibilidad de extracción de Alpha.
  • Estrategias de Market Microestructura. Extracción de valor sobre las oportunidades del flujo de órdenes y las dinámicas del libro de órdenes. Usualmente utilizadas en el muy corto plazo-
  • Estrategias de Arbitraje Estadístico. Explotación sistemática de las relaciones entre los activos con similares características. A diferencia del puro arbitraje "sin riesgo", el arbitraje estadístico, sí que implica riesgo.
  • Estrategias Textuales. Estrategias que basan su lógica de decisión en modelos textuales LLM con información de noticias, reportes, documentos internos, búsquedas en internet y otras fuentes de información.
  • Estrategias Temáticas/Macro Estrategias de cesta de activos basados en decisiones macro sobre el desarrollo económico.

Existen dos grandes grupos de modelos

  • Los basados en hipótesis, o deductivos: El punto de partida es la investigación de donde existe una oportunidad de rentabilidad, y porque existe. Depende en tesis económicas o en mecánicas internas del mercado. Usualmente, viene precedido por el trabajo empírico.
  • Los basados en patrones inductivos: Esta aproximación tiene una naturaleza exploratoria, donde descubre ventajas emergentes del trabajo empírico. Hay que ser extremadamente crítico y cuidadoso para distinguir entre correlación y causalidad.
    Los modelos más clásicos son:

Como se desarollan las estrategias quant?

  • Research y Formulación
  • Desarrollo de Señales
  • Adquirir y procesar los datos
  • Analizar los datos
  • Desarrollar la estrategia para ir a mercado y dejarlo en modo test
  • Analizar, testear y valorar la el quant model
  • implementar a real si todo ok

Formulando hipótesis sobre ideas y estrategias de trading

Para tener éxito en el trading quant, puede ser por dos motivos, por suerte, o por la realización de un buen trabajo.

Para hacerlo mediante el trabajo, todo empieza con una idea basada en una intuición económica, un comportamiento interno del mercado, o una anómala.

Tener acceso a una colección de research pública, como privada, facilita las cosas, dado que los papers públicos de internet, son como los electrodomésticos abandonados en la basura, quizá con unos arreglos, sea funcional, o quizá no sirva para nada, pero está claro que alguien ya ha utilizado la anomalía hasta exprimirla, y posteriormente lo ha publicado.

Algo lógico pensando la cantidad de recursos y tiempo que se dedica a predicar por el desierto (la labor de research), hasta que se encuentra un poco de Alpha de algún lado.

Además, diferenciar, las ideas de trading, con las estrategias quant. Una estrategia quant está orientada al largo plazo, mientras que una se añade trading, tiene un horizonte específico mucho más corto, buscando un desajuste específico en un evento, o mal priceado, mientras las estrategias quant buscan explotar oportunidades más asociadas con anomalías, o desajustes.

Generando Señales

Las señales crean un marco para generar una estrategia de inversión. Utilizando los datos con los que hemos formulado, generamos un método para medir de forma cuantitativa los aciertos que representan la idea de inversión

Aunque varía en función de la idea o la tesis de inversión, en esta etapa, dentro del ecosistema de Python quant con zipline, se suele utilizar la librería pyfolio para realizar este análisis de señales.

Ejemplo de una señal: Un positivo producido por un análisis de sentimiento de noticias. Las señales no implican entrada inmediata, sino cambio de estado, a buscar la entrada, o a seguir la siguiente instrucción del modelo.

Adquiriendo y procesando datos

El corazón de todo modelo, de toda investigación, viene de los datos. Los datos es la parte más crítica del proceso. Y con errores en los datos, solo hay errores en los estudios y procedimientos.

¿Qué son los datos buenos?

Son los datos que cumplen una serie de requisitos obligatorios.

  • Que sean consistentes en su deficion y a lo que representan
  • Que tengan suficiente detalle sobre subyacente del dato
  • Que tenga una disponibilidad temporal adecuada
  • Que sea consistente sobre el el tiempo
  • Que este libre de "look-ahead" o bolas de cristal
  • Que este libre de sesgos de supervivencia

Además, a la hora de trabajar con datos y su almacenamiento, en una reputada gestora, se requería que todos sus sistemas funcionaran de la siguiente forma:

  • Histórico de desarrollo del datalake
  • Entender los procedimientos estándar de uso del datalake, y las diferencias entre diferentes fuentes
  • Informe de riesgos sobre riesgos en los datos.
  • Redundancia de feeds. Varios feeds para un mismo activo, además muy importante para la etapa de backtesting, tener información en diferentes fuentes.
  • Uso de metadatos, versiones y Snap
  • Informe de Outliners y su hipótesis de expiaciones económicas.

Las condiciones técnicas vienen cubiertas por el uso de arcticdb, y las tacitas, no se necesitan recursos extremadamente especiales para llevarlas a buen término. Por lo cual podemos crear un entorno near-to-profesional con soluciones open-source y muy poco coste.

Análisis de Señales

Dentro del análisis de señales, nos centramos en los test estadísticos y las técnicas econométricas sobre los datos y los resultados del modelo, para evaluar de forma empírica las propiedades de las señales. Pyfolio es el candidato ideal para esta labor en la mayoría de las ocasiones. Es la unidad de Alpha mínima necesaria, para crear más completos quant systems.

Construyendo la estrategia

Un modelo representa las normas matemáticas o sistemáticas de un sistema de trading. En este caso vamos a pasar nuestro modelo a una forma menos abstracta. Vamos a concretar el modelo. Trabajaremos la selección de señales y la combinación de señales entre sí misma, además condiciones exógenas, como la inercia económica en la estrategia de trading (si el mercado se mata mucho, quédate tranquilo... y cosas así)

Evaluación, Testeo e Implementación.

En esta etapa final, estimaremos la calidad del modelo y la calidad de los forecast. Nuestro análisis incluirá como de bien se ajusta dentro del periodo, y fuera del periodo. Nuestro objetivo será obtener una validación empírica del sistema, y testearlo.

Decidiremos sobre como implementarlo, en función del bróker/exchange, necesidades de velocidad, etc. y se inicializarán las pruebas en un entorno real pero controlado sobre los procedimientos, para una futura implementación real.

En este punto, el researcher debe evaluar la validez de la estrategia, y el criterio y la experiencia es vital.

Tips para desarrollar modelos

  • Selecciona bien tus fuentes iniciales de research. Evita gurus, o cualquier otra fuente inicial que no tenga un raciocinio científico.
  • Entiende las ideas de lo que quieres investigar, las premisas por debajo del modelo, qué decisiones toma, y por qué las toma
  • Fórmula hipótesis alternativas. Tu objetivo principal es descubrir que tu modelo es tan robusto, que no se puede "romper". Pero es conveniente tener siempre hipótesis alternativas.
  • Haz cambios (razonables) a las premisas iniciales, si las premisas, o descubrimientos lo sugieren, con el fin de aumentar la robustez
  • Busca evidencia de lo contrario, para fortalecer la hipótesis principal
  • Focus en la causalidad y las probabilidades más que en la correlación estadística.
  • Descompón el modelo por partes u objetos, e intenta validarlos individualmente.
  • Conócete a ti mismo. Averigua cuanto sabes de la tesis de inversión, y qué cosas sabes que no sabes. (las cosas que NO sabes que No sabes, entran dentro del comportamiento aleatorio del mercado)

Uso de Modelos

Las utilidades de los modelos cambian en función quién lo esté utilizando. Por ejemplo, para los inversores cuantitativos, los modelos producen señales sobre retornos esperados a futuro sobre un activo, o una cartera, mientras para los inversores fundamentales, un forecast de un modelo, crea nueva información, que necesitan sintetizar junto con otra información cualitativa, para poder mejorar las decisiones.

El modelo en sí no tiene un propósito general final, más que aportar información y ventajas a quienes los usan a la hora de obtener retornos futuros. La clave del éxito corresponde con sintetizar información de múltiples fuentes, encontrando las fortalezas y debilidades de cada aproximación.

A diferencia del análisis técnico, que podríamos definir, como un grupo de personas que intentan predecir la dirección de un vehículo conducido por un mono borracho en función a las marcas que van dejando las ruedas en el asfalto. Y mediante un cúmulo de sesgos, autosabotear su lógica y validar su operativa.

Referencias

[2016] Best practices in research for quantitative equity strategies. The Journal of Portfolio Management 42 pp 135-143