Вопросы по работе библиотеки okama

Sergey · 03.Январь.2021 12:07:22

Добавлю примеры корреляции в ближайшем обновлении. Самый простой способ расчета корреляции через .ror.plot() основывается на всей доступной статистике. Данных внутри дня там нет. Только месячные данные (adjusted close). Вы можете считать скользящую корреляцию на любых промежутках задавая размер окна в месяцах ror.rolling(window=24).plot()
Визуализацию можно использовать любую. Я показываю на matplotlib, но можно спокойно использовать Seaborn… Это дело вкуса.
Оптимизация с ограничениями (constrained optimization) в okama тоже есть. Можно задавать ограничения на любые веса. Но пока не успел сделать описание этого в ноутбуке. Сами мы активно это используем в процессе создания портфелей.

Что касается полной доходности по ценным бумагам, то она по умолчанию такая, т.к. вместо обычных цен закрытия мы используем adjusted close (учитывает в цене дивидендный доход с учетом реинвестирования). Как раз сейчас немного не хватает ценовой доходности портфеля или актива без учета дивидендов. В планах ввести такие метрики.

Прогнозы делаются сейчас либо по историческим данным либо по свойствам распределения случайной величины. Это основные подходы, рекомендованные в частности CFA. Возможно, в будущем появится и что-то еще. Но главное сейчас, это реализовать общепринятую математику, которая применяется повсеместно.

Safe Withdrawal / Perpetual Withdrawal rates - действительно полезные метрики. Вообще для нас PortfolioVizualizer один из основных “источников вдохновения”
В первую очередь мы планируем сделать прогнозирование wealth index с учетом регулярных пополнений.

Большое спасибо за ваши идеи, вопросы и рекомендации!

Sergey · 03.Январь.2021 12:09:16

Просмотрел этот вопрос. Везде, в т.ч. в describe доходности являются полными (Total Return).

mne70let · 03.Январь.2021 13:49:35

Сергей, спасибо Вам. Значит, можно полностью на Okama переходить и поддерживать отечественного производителя )

С adjusted close непростая для меня история.
До того, как я узнал про готовые библиотеки, я тянул цены с бесплатных околобиржевых api, которые в основном агрегируют данные с yahoo finance. И, насколько я понял из поддержки, adjusted close в yahoo finance учитывают сплиты и скачки котировок при выплате дивидендов, но не реинвестирование, посмотрите, например, здесь:
https://help.yahoo.com/kb/SLN28256.html#:~:text=Adjusted%20close%20is%20the%20closing,Security%20Prices%20(CRSP)%20standards.

Из-за этого, CAGR с реинвестированием приходилось считать самому. Оно, как мне казалось, и понятно, так как доходность с реинвестированием зависит от таймфрейма и должна пересчитываться на каждый заданный период. Может быть, я не до конца разобрался.

Если в okama это уже реализовано, то здорово. Главное, чтобы не оказалось так, что, например, по российским бумагам доходность полная, а по американским ценовая или наоборот. Это может на неверные выводы навести в некоторых случаях.

Sergey · 03.Январь.2021 14:14:58

Adjusted close price - по определению предполагает реинвестирование дивидендов. Причем, если данные дневные, то цена реинвестирования принимается равной цене закрытия. Это некоторое допущение. Но такова модель. Кроме того, в этой модели есть реально неприятные изъяны на уровне математики. Но что делать … adjusted close - это мировой стандарт. Приходится с ним работать, несмотря на все неточности. Есть конечно, вариант, пересчитывать всё самому, но это очень глобальная работа. Мы до такого еще не скоро созреем.
Здесь есть неплохая дискуссия на эту тему:

mne70let · 03.Январь.2021 14:41:29

Да, теперь разобрался, спасибо.

mne70let · 09.Январь.2021 12:59:55

Сергей, по-моему, это не должно быть большой проблемой - Yahoo Finance (в т.ч. питоновская библиотека уfinance и всевозможные API) выдают Close и Adj Close. Первое - это как раз чисто ценовой индекс с учетом только сплитов. API Мосбиржи, насколько я знаю, выдает ценовые показатели по отдельным бумагам. Дивиденды отдельным запросом.

Но вообще интересно, под какую идею Вам чисто ценовая доходность нужна?
В ценах же ещё и байбэки сидят, а это те же дивиденды по сути - их тоже вычищать придется.

Sergey · 11.Январь.2021 13:20:01

Close - это без учета чего бы то ни было. Сплитов там нет. Просто цены закрытия. А вот в adjusted close как у Yahoo Finance, так и у всех остальных учтены все сплиты и дивиденды.

Проблем с получением цен закрытия нет. В базе данных okama они уже присутствуют. Они даже доступны через ok.QueryData.get_close().

В ближайших планах сделать временной ряд цен закрытия атрибутом актива. Нужно это много где. Например, при расчете дивидендной доходности используется не adjusted close а именно цены закрытия. Для понимания, какая часть доходности получена за счет дивидендов на длинных промежутках времени нужны оба показателя. История изменения цены на бумагу сама по себе полезная характеристика.

mne70let · 11.Январь.2021 20:30:39

На сайте yahoo finance Close все таки с учётом сплитов:

Sergey · 13.Январь.2021 04:43:22

На сколько я знаю, официально Yahoo Fainance API сейчас не поддерживается. Но раньше они предоставляли цены закрытия без всяких поправок на сплиты. То, что они отображают на графиках не обязательно должно быть одинаковым с данными API.

dknu · 27.Январь.2021 07:45:49

Видимо, по каким-то активам забыли загрузить данные по сплитам. Например, по UVXY.US:

Возможно, это единичная ошибка

dknu · 27.Январь.2021 10:13:07

Вопросы по российским фондам:

Namespace MOEX:
Common Stock 288
ETF 9
INDEX 4

Почему всего 9 ETF, хотя на ММВБ их сейчас 16?

Namespace PIF:
Всего 438 фондов. Я поначалу думал, что это только открытые, интервальные и биржевые, но в базе есть и ряд закрытых фондов. А некоторых фондов, которые активно торгуются на бирже, почему-то нет, например, ФПР Восток-Запад (( Есть ли планы добавить в базу все фонды, которые котируются на ММВБ?

Sergey · 28.Январь.2021 05:02:21

На сегодня в MOEX есть 32 ETF/БПИФ (обновили вчера):

image.png579×705 18.8 KB

Пока там нет новейших БПИФ, появившихся в декабре. Скоро добавим.
В PIF по идее должны попадать только открытые фонды. Если попало что-то лишнее, то это ошибка. Если не сложно, дайте пример закрытого фонда из PIF.

Sergey · 28.Январь.2021 05:06:11

Действительно, у UVXY был сплит 1/5 в сентябре 2018: https://www.splithistory.com/?symbol=uvxy
Добавим в ближайшее время.

dknu · 29.Январь.2021 07:27:37

Странно, но у меня тот же запрос выдает совсем другие данные:

dknu · 29.Январь.2021 07:46:59

3 крупнейших ЗПИФ:

Но ценовые данные по ним не выдает:
Exception: (‘Error fetching data for 3164.PIF:’, 500, ‘Internal Server Error’, ‘http://185.63.191.70:5000/api/ts/adjusted_close/3164.PIF’)

Sergey · 30.Январь.2021 09:40:40

Скорее всего, где-то кэшируются данные. Вы всегда можете проверить, что на самом деле выдает API: http://185.63.191.70:5000/api/namespaces/MOEX

Что касается закрытых ПИФ, пока не понятно как они попали в базу.

DizzyJump · 02.Февраль.2021 13:03:01

Подскажите как праивльнее получить в okama доходность инструмента за произвольный период, например за последние 6 месяцев? Возможно даже уже есть такой функционал и я его просто не нашёл.
Я пока это так делаю, но есть ощущение что должен быть способ проще:

ls = ['FXGD.MOEX','VTBX.MOEX','VTBE.MOEX','SBGB.MOEX','RUSB.MOEX','FXTB.MOEX','FXDE.MOEX','FXCN.MOEX','FXUS.MOEX']
data = [ok.QueryData.get_close(ticker,first_date=first_date, last_date=last_date, period='M') for ticker in ls]
open_end = [(d[0], d[d.count()-1]) for d in data]
profits = [(t[1]-t[0])/t[0] for t in open_end]

Было бы здорово если бы алгоритм ребалансировки портфеля был завёрнут в какой-нибудь абстрактный патерн типа Strategy/Policy, что бы его можно было переопределять и экспериментировать с разными подходами к ребалансировке.

Sergey · 03.Февраль.2021 03:39:49

В классе ‘AssetList’ есть метод .get_cagr(period=None). Он считает полную среднегодовую доходность на произвольных периодах. Возможные значения для period: “YDT” (доходность c начала года), “none” (за весь период) или любое натуральное число (количество лет).
CAGR (Compound Annual Growth Return) - не считается на периодах меньше года, поэтому значения периода меньше года не допускаются.

Кроме того, есть метод .describe([1, 5, 10]), где считаются среднегодовые доходности сразу за произвольное количество периодов одновременно (по умолчанию 1, 5 и 10 лет) и за весь срок.

В на GitHub уже доступна к скачиванию версия с атрибутом .cumulative_return, который считает накопленную (не приведенную к году) доходность за весь срок. Если нужно именно за последние 6 месяцев, то можно отрегулировать срок для AssetList при помощи first_date и last_date, а дальше применить .cumulative_return.

П.С. в вашем примере вы посчитали только ценовую доходность, т.к. close не учитывает полученные дивиденды.

Было бы здорово если бы алгоритм ребалансировки портфеля был завёрнут в какой-нибудь абстрактный патерн типа Strategy/Policy

В планах внедрить параметр rebalancing_period в классе Portfolio для изучения свойств портфеля при разных периодах ребалансировки.
Сейчас есть метод .get_rebalanced_portfolio_return_ts, который позволяет получить временной ряд месячных доходностей для портфеля с годовой ребалансировкой (period=‘year’) или без ребалансировки вообще (period=‘none’). Из этого временного ряда довольно просто получить другие параметры доходности и риска для таких портфелей. Кроме того, .describe() для портфелей показывает сразу среднегодовые доходности на всех периодах для портфелей с ежегодной ребалансировкой, т.к. это наиболее популярный период.

dknu · 05.Февраль.2021 08:32:14

Почему большая часть функций в библиотеке работает только с месячными данными (helpers.py)? В принципе текущий код может быть легко адаптирован для данных с любой частотой, а для ряда функций даже менять ничего не надо…

Sergey · 05.Февраль.2021 09:58:28

Причин несколько:

Основная цель библиотека - работа в рамках Современной теории портфеля с долгосрочными инвестициями. Для этого нужны прогнозы и анализ данных глубиной в годы. Месячных данных данных для этого обычно достаточно. Результат как по доходности, так и по всем метрикам риска обычно приводится к годовым значениям. В дневных данных есть смысл, только если не хватает глубины истории по месячным. Внутри дня данные просто не нужны.
С дневными данными есть технические сложности … Библиотека работает с наборами ценных бумаг, которые торгуются на разных биржах мира. Все фондовые рынки работают по своим расписаниям. Для одних бирж первое января является рабочим днем, для других нет. Работать с такими наборами, где выпадают дни, сложно. Можно конечно, просто убирать дни, когда где-то нет торгов. Но тогда будет выпадать много информации. Можно использовать цены закрытия предыдущих дней, когда торги были. Но это будет искажать данные по риску. В общем, необходимо решать такого рода сложности. А полезность при этом под большим вопросом.