Archive of libmdbx telegram group messages

21 December 2022

Л(

16:57

Леонид Юрьев (Leonid Yuriev)

In reply to this message

Еще раз: одновременно с одной базой могут работать только более-менее одинаковые версии libmdbx (с одинаковым форматом LCK-файла).
Поэтому подружить можно только уровняв версии libmdbx.

A

17:03

Aртём

Это понятно. У LCK есть свой номер версии формата ? В хедер файле прописан гдето ? как мне их сопоставить имея разные имплементации на go/rust. Можно конечно брать разные версии под раст, компилить и запускать, подбирать версии пока не заработает. Но это дно.

Л(

17:11

Леонид Юрьев (Leonid Yuriev)

In reply to this message

Технически libmdbx встраивается либо как git submodule, либо в виде амальгамированных исходников (см README).
Вам нужно решить какую версию вы ходите использовать и собрать биндинги и/или erigon с её использованием.

В амальгамированных исходниках информация о версии присутствует в очевидном виде, а также выводится при запуске mdbx_chk с опцией -V.

👍

A

29 December 2022

Л(

21:07

Леонид Юрьев (Leonid Yuriev)

Немного бенчмарков (коммит 589b1db869473b14943d7703558fa7e69bcee0c5):

/dev/shm + MDBX_WRITEMAP + MDBX_UTTERLY_NOSYNC

  RUNNING ioarena for mdbx/25000000...
  libmdbx.so => ./libmdbx.so (0x00007f0ba499e000)
 batch×N: 430.809 ops/s
    crud: 226.522Kops/s
 iterate:  44.875Mops/s
     get:   3.058Mops/s
  delete: 280.706Kops/s
  RUNNING ioarena for lmdb/25000000...
  liblmdb.so => /xyz/ioarena/@BUILD/db/lmdb/libraries/liblmdb/liblmdb.so (0x00007fa660039000)
 batch×N: 387.632 ops/s
    crud: 131.040Kops/s
 iterate:  46.146Mops/s
     get:   3.234Mops/s
  delete: 190.746Kops/s

SSD + MDBX_SYNC_DURABLE

  RUNNING ioarena for mdbx/25000000...
  libmdbx.so => ./libmdbx.so (0x00007fbe9bfab000)
 batch×N:  68.373 ops/s
    crud:  11.146Kops/s
 iterate:  44.991Mops/s
     get:   2.991Mops/s
  delete:  10.204Kops/s
  RUNNING ioarena for lmdb/25000000...
  liblmdb.so => /xyz/ioarena/@BUILD/db/lmdb/libraries/liblmdb/liblmdb.so (0x00007f2e30115000)
 batch×N:  68.081 ops/s
    crud:   7.153Kops/s
 iterate:  46.371Mops/s
     get:   3.219Mops/s
  delete:   8.327Kops/s

libmdbx медленнее LMDB в сценариях iterate и get из-за дополнительных проверок.

Еще стоит отметить, что в libmdbx накладные расходы на запуск транзакций чуть больше (примерно на ½ микросекунды).
Набегает из-за бОльшего контроля и проверок, трех мета-страниц и т.п.

Все бенчмарки под Linux, посредством make bench-couple BENCH_CRUD_MODE=xxx

👍

СМ

A

31 December 2022

Л(

23:06

Леонид Юрьев (Leonid Yuriev)

С наступающим!

🔥

b

6

👎

AL

t

4

👍

1

5 January 2023

Alisher Ashyrov invited Alisher Ashyrov

6 January 2023

22:53

Deleted Account

In reply to this message

What is batch x N here? N mean 25M?

7 January 2023

Л(

01:00

Леонид Юрьев (Leonid Yuriev)

In reply to this message

The size of a batch.
It is 500 by default for ioarena.

👍

01:06

Выпуск v0.12.3 "Акула"

https://gitflic.ru/project/erthink/libmdbx/release/35a2dcd5-7b7f-48a2-b038-74f5df96bfb8

👍

YS

LP

A

01:09

Aртём

Не привычно читать whats new на русском. Аж душу греет.

👍

YS

Л(

❤

AV

AS

05:08

Alex Sharov

In reply to this message

Отличное название чтобы проапгрейдиться

👍

Л(

21:14

Леонид Юрьев (Leonid Yuriev)

В Сети можно найти информацию, о том что производительность libmdbx не соответствует моим заявлением, и в частности что libmdbx даже медленнее LMDB.

Например, я нашел комментарий Kris Zyp, в котором он написал «… I just haven't found any performance gains (actually inferior performance) with my benchmarking of libmdbx».

Поэтому считаю необходимым дать некоторые пояснение по этой теме, а также прошу передать эту информацию Kris Zyp (на почту он не отвечает, а на Github мой аккаунт заблокирован).

В libmdbx много что сделано именно для увеличения производительности, но также добавлены дополнительные возможности и масса проверок для страховки от сбоев и потери данных при неправильном использовании API и в других непредвиденных ситуациях.

Поэтому в самых простых случаях libmdbx действительно оказывается чуть-чуть медленнее, так как процессору нужно сделать чуть больше операций, даже если весь код близок к оптимальному. Но чем сложнее сценарии использования, чем больше БД и размер транзакций — тем больше будет выигрывать libmdbx, и некоторых сценариях это превосходство будет кратным (в несколько раз).

Тем не менее, нельзя исключать что в libmdbx есть какие-то недочеты и упущения, которые замедлят работу в определенных ситуациях. Поэтому я всегда стараюсь разбираться со всеми жалобами на производительность, коих очень мало.

21:15

Думаю для формирования общей картины мне достаточно описать основные случаи и причины, когда libmdbx действительно медленнее LMDB:

1. На Windows всё может быть печально из-за медленных файловых блокировок.
В libmdbx намеренно используются файловый блокировки для сериализации транзакций записи. Это страхует пользователей от «резервного копирования» БД при выполняющейся транзакции, из-за чего получаемая копия оказывается невалидной. Это достаточно серьезная проблема, так как пользователи могут не подозревать что используемое ими ПО работает не совсем корректно и узнать о проблеме только при безвозвратной потере данных.
В самих же файловых блокировках нет ничего плохого, в Windows они медленные потому что так реализованы.
Захват и освобождение файловых блокировок может занимать сотни микросекунд, что существенно больше длительности самих транзакций в некоторых сценариях использования. Соответственно, в таких сценариях libmdbx может показывать производительность в разы меньше чем LMDB.
В libmbx не планируется каких-либо связанных с этим улучшений, напротив в будущем в новых версиях libmdbx поддержка Windows будет прекращена (как говориться в одном русском анекдоте «стюардессу пора закопать»).

2. В libmdbx старт транзакции чуть медленнее, примерно на 0.5 микросекунды на актуальных платформах.
В libmdbx в БД три мета-страницы вместо двух LMDB, управление геометрией/размером БД, контроль «некогерентности» странично-буферного кэша ядра и т. д. Всё это требует каких-то небольших затрат ЦПУ, в сумме набирается около 500 наносекунд.
Это кажется мизерным значением, но для крохотных транзакций оно может составлять 5% от общего времени и в простейшем бенчмарке из 100 миллионов таких итераций разница может быть до 50 секунд в пользу LMDB.
Когда будет время и желание я постараюсь уменьшить эти накладные расходы, но пока есть более важные задачи.

3. Вызовы API не выполняющие какой-либо существенной работы в libmdbx чуть-чуть медленнее из-за большего контроля.
В libmdbx выполняется больше проверок, с тем чтобы (например) при неверном использовании API явно возвращать код ошибки, и тем самым минимизировать вероятность сложно-воспроизводимых вероятностных ошибок (aka heisenbug).
Оценить замедление в реальных сценариях использования можно на примере бенмарков ioarena в сценариях «iterate» и «get», где libmdbx отстаёт от LMDB примерно на 1-2%.
Это отставание может быть как больше, так и меньше и сильно зависит от наличия vDSO, актуальной tls-model и их реальной эффективности на конкретной платформе.
Большинство таких проверок можно отключить задав соответствующие опции сборки (см. src/options.h).

4. Защита от «некогерентности» странично-буферного кеша ядра ОС.
До версии 0.12.3 при записи страниц всегда выполнялась сверка записанных в файл данных с отображением в ОЗУ.
Это давало полную гарантию от проявление проблемы, но в некоторых синтетических тестах наблюдалось снижение производительности до 10-15%.
При этом также был активен вторичный дублирующий контроль в момент чтения мета-страниц при старте транзакций.
В текущем понимании, по результатам полугодичного использования, серии тестов и экспериментов, достаточно только вторичного контроля.
Поэтому в 0.12.3 по-умолчанию работает только второй механизм, а полную сверку можно включить посредством опции MDBX_FORCE_CHECK_MMAP_COHERENCY=1 при сборке.
Этот компромисс между надежностью и производительностью я расцениваю как достаточно рациональный — в LMDB эффект «некогерентности» не считается проблемой, а в libmdbx работает легковесная проверка не давшая ни одного сбоя и есть возможность включения полного контроля.

Как-то так.
// похоже я подхватил грипп (

🔥

EI

YS

AV

4

👍

1

AV

22:18

Artem Vorotnikov

In reply to this message

Выздоравливайте, Леонид

👍

YS

i