Программирование своей БД. Чтения/запись БД несколькими юзерами. (Си)

2FED · 3 фев 2009

_basmp_ сказал(а):

конкретно по данному вопросу - при удалении или увеличении длины записи - ссылки на старую запись с соседних удаляются (они соединяются между собой), а сама запись помещается в список/дерево удаленных, отсортированный по длине записи. при выделении места под новую/удлиненную запись сперва просматривается этот список.
Нажмите, чтобы раскрыть...

хорошая идея к стате, прийму на заметку а ещё можно сделать функцию дефрагментирования базы

_basmp_ · 3 фев 2009

2FED

хорошая идея к стате, прийму на заметку а ещё можно сделать функцию дефрагментирования базы
Нажмите, чтобы раскрыть...

тут видимо не статья нужна. это просто пару слов на тему. хорошо бы саму либу изделать.
дефрагментацию можно делать. можно даже индикатор фрагментированости прицепить. Только само оно не сделается.

Rel
связи между таблицами по полю - нормальное свойство бд.
(http://sourceforge.net/project/showfiles.php?group_id=4451&package_id=4468)
проблема в самой организации. быстрый доступ к записи, модифицируемость, малая избыточность, многопользовательская/многопоточная работа, защищенность от сбоев, варианты данных допустимых к помещению в запись/поле, приватность итд. подумать об этом будет интересно и полезно.

вобщем я сказал. а как вы - говорите. авось что и выгорит

2FED · 3 фев 2009

_basmp_ я имел ввиду "кстате" а не "к статье"

угу мне тож идея очень нравица, просто недавно делал подобие ini файла.

_basmp_ · 9 фев 2009

один тс, один пожелавший рук доложить, один просто небезразличный и дело встало. место под проект володя предоставляет. с траком вики и проч.

(жуткая вещь эта вики. удивительно работящие и удивительно близорукие школьники ее разработали. даже удивительно ее популярносте. видать за неимением конкурентов)

Rel · 10 фев 2009

прежде чем начинать разработку чего то, необходимо решить в какой среде будете реализовывать? С++? далее как база будет теоритически выглядеть? как будет происходить внутреннее связывание? как баз будет хранится в памяти во время выполнения? как база будет хранится в файле? и многие другие...

про дефрагментируемую базу - это канеш хорошо... таким образом в файле будут хранится обрывки данных, а в памяти индексы (указатели на эти обрывки, чтобы по ним можно было восстанавливать данные)... по факту я предлагаю делать так - справочник в отдельном файле со всеми данными... и отдельно файл с индексами... при начале работы пользователь загружает в память индексы (хотя можно подумать, как тож динамически подгружать), затем база подгружается из второго файла по мере необходимости динамически при построении списков элементов и тд... отсюда вытекает вопрос: получается при изменении базы придется переписывать файл с индексами, и обновлять его во всех других процессах работающих с базой, так?... это канеш проще, чем обновлять из второго файла всю базу в память, но тож не есть гуд...

_basmp_ · 11 фев 2009

Rel
на чем писать тут дело 10е. хоть на 3х разл языках 3и разл реализации. а вот сам формат файла(ов) бд обмозговать - самое важное.
(лучше не писать кучей, а по пунктикам. в формате

<номер>) <критика>; <предложение>; <обоснование>.

и через строчечку. так будет читабельнее)

предлагаю щас оставить вопросы связей, памяти итд. и сосредоточиться именно на формате файла бд с картинками в виде структур C

пример

Код (Text):

uint32 magic;

struct Header {

struct RecordRoot* recordsList;

struct RecordRoot* recordsIndexTree;

struct RecordRoot* deletedList;

struct RecordRoot* deletedLengthTree;

//---------

char* indexCriterion;

//---------

char* fieldsDesc;

};

struct RecordRoot {

char writeLock;

char flags[3];

//--------

struct RecordRoot* left;

struct RecordRoot* right;

//--------

struct RecordRoot* prev;

struct RecordRoot* next;

//--------

struct Record* record;

};

struct Record {

int length;

union {

struct {

int64 writeDateTime;

struct Record* variant;

char record[1];

} live;

struct {

struct Record* left;

struct Record* right;

}deleted;

} d;

};

и место под запись выделять определенными порциями. например степенями 2ки. это облегчит расширение записи, ускорит перезаюзывание поиск/сортировку удаленных записей. и не приведет к большой избыточности (предполагаю. надо продумать/проверить)

(чето голова уже не варит. завтра проверю/поправлю/дополню)

Rel · 16 фев 2009

рассматривая формат файла, я предлагаю делать так:
- у каждой записи есть набор "позиций" вида:
-- смещение позиции относительно начала файла
-- количество данных по позиции

- при удалении все позиции записи обнуляются, позиция заносятся в список пустых позиций

- при добавлении заполняются пустые позиции из списка, начиная с ближайших к началу файла позиций, если этих пустых позиций не хватает, чтобы записать данные, то остаток данных дописывается в конец файла

- при дефрагментации базы части данных переносятся друг к другу, таким образом заменяя список позиций на одну позицию для одного элемента справочника

+: вроде адекватно и просто в реализации, не использует избыточность...
-: необходимо где-то хранить набор "позиций", например в отдельном файле, к тому же при изменении базы этот набор позиций придется переформировывать; недефрагментированная база будет работать на порядок медленнее дефрагментированной, ну во всяком случае мне так кажется))))

что думаете по этому поводу?

t00x · 16 фев 2009

что думаете по этому поводу?
Нажмите, чтобы раскрыть...

дайте определение слову "позиция".

_basmp_ · 16 фев 2009

Rel
простой пример.

у вас в бд кроме всего хранятся строки, причем % относительно длинных невысок (скам 5%). как быть при фиксированой длине записи (я так понял - это ваш вариант)?

и такой вопрос

зачем вам нужен быстрый доступ по номеру несортированой записи? где это так часто применяется?

Rel · 17 фев 2009

я наверное непонятно объяснил... вот допустим есть файл, в нем:

<НАЧАЛО_ФАЙЛА> БАЗ00000АДАН0000ЫХ00000000000..................... <КОНЕЦ_ФАЙЛА>

здесь показан вариант хранения строки "БАЗАДАННЫХ" в файле, нули - это какая-то другая информация (другие поля, не представляющие на данный момент интереса)... таким образом, чтобы знать, что где данная строка хранится в файле, нужно индексирование... индексирование предлагаю делать парой чисел (смещение относительно начала файла, количество данных по смещению)... то есть строка в индексе будет выглядеть, как набор: (0, 3), (8, 4), (16, 2) - то есть фактически координаты кусочков строки в файле базы данных...

дайте определение слову "позиция"
Нажмите, чтобы раскрыть...

позиция - как раз и есть пара чисел (смещение относительно начала файла, количество данных по смещению), которая указывает на фактическое расположение данных в файле бд...

как быть при фиксированой длине записи (я так понял - это ваш вариант)?
Нажмите, чтобы раскрыть...

я ваще считаю, что необходимо забыть о фиксации размера полей... хороший тон - сделать каждому элементу возможность использования произвольного количества полей произвольной длины...

зачем вам нужен быстрый доступ по номеру несортированой записи? где это так часто применяется?
Нажмите, чтобы раскрыть...

извините, не понял вопроса... и к чему он был задан...

t00x · 17 фев 2009

Rel
какие форматы данных можно будет хранить в файле БД?

интересный топик, тем более что после "ожирения" MySQL "лёгеньких" субд практически не осталось.

P.S.
ссылка из #12(ESDB) не открывается

Voodoo · 17 фев 2009

t00x
а sqlite не легкий?

_basmp_ · 18 фев 2009

Rel
-- как вы хотите получать доступ к отдельной записи еще до первой индексации?
-- индекс у вас - линейный список?
-- зачем нужны длины записи в индексе
-- как вы предлагаете реализовать произвольное количество полей между разными записями одной бд? как с этой фичей вообще работать??

предлагаю вопроса полей пока не касаться. сначала определимся с записями и навигацией по ним

Rel · 18 фев 2009

какие форматы данных можно будет хранить в файле БД?
Нажмите, чтобы раскрыть...

вообще я предпологал основной упор делать на строки, но также предполагал хранить неограниченого размера целочисленные типы (знаковые и беззнаковые), а так же неограниченные числа с плавающей точкой... но об этом потом поговорим...

как вы хотите получать доступ к отдельной записи еще до первой индексации?
Нажмите, чтобы раскрыть...

никак... в том то и проблема индексирования... придется перелопачивать каждый раз индексы, при изменении базы, а так же где то их сохранять, чтобы система, по которой производились записи, не потерялась... это канеш много работы для бедного компа((((

индекс у вас - линейный список?
Нажмите, чтобы раскрыть...

по сути дела да... список записей вида (смещение относительно начала файла, количество данных по смещению)...

зачем нужны длины записи в индексе
Нажмите, чтобы раскрыть...

длина записи определяет сколько данных (в данном случае букв) было записано с такой координатой... фактически это можно заменить на (смещение начала данных; смещение конца данных), но на хранение длины в памяти всетки меньше места нужно... мне кажется, что на практике хватит и одного байта)))))

как вы предлагаете реализовать произвольное количество полей между разными записями одной бд? как с этой фичей вообще работать??
Нажмите, чтобы раскрыть...

заложить все эти данные в индексный файл... а в базе данных хранить записи для каждого вида (наименование поля; тип поля; значение поля) - соответственно типизировать их как (строка; байт; произвольный тип, указанный типом поля)... эта фича канеш увеличит фактический объем базы на диске, однако фича - есть фича))))

Rel · 25 фев 2009

UP! чеж все тему забросили, или кроме меня ни у кого идей нет? >

_basmp_ · 1 мар 2009

тему не забросили. просто я щас немного крепко занят.

про ваши идеи - напишу.

тк плучить доступ к записи кроме как по индексу у вас невозможно, то и нет смысла разделять на 2 файла. тк приутере индекса будет утеряна база полностью

линейная организация индекса при больших базах и возможности вставки в середину - будет серьезным тормозом.

при наличии в разных записях совершенно разных неупорядоченых наборов полей с разными названиями и типами - как вы предлагаете их индексировать и как в этом всем чтото быстро находить?

еще раз предлагаю не связывать себя возможными типами. это могут быть и строки, и числа, и картинки, и блоки кода/данных, и другие таблицы итд.

для начала надо прийти к одному пониманию формата базы. тк он определит и все дальнейшие возможности и ограничения. свой вариант я набросал выше.

Rel · 2 мар 2009

тк плучить доступ к записи кроме как по индексу у вас невозможно, то и нет смысла разделять на 2 файла. тк приутере индекса будет утеряна база полностью
Нажмите, чтобы раскрыть...

да... с этим канеш полностью согласен...

линейная организация индекса при больших базах и возможности вставки в середину - будет серьезным тормозом.
Нажмите, чтобы раскрыть...

ну на чтение/запись как раз будет все быстро происходить... но вот сортировка или поиск будет довольно долгой операцией...

для начала надо прийти к одному пониманию формата базы. тк он определит и все дальнейшие возможности и ограничения. свой вариант я набросал выше.
Нажмите, чтобы раскрыть...

тот вариант, что вы предложили, хранит либо действующий элемент базы, либо, если элементы был удален, указатели на предыдущий и следующий элемент... но из этого следуют несколько ограничений... я предлагаю немного переработать ваш вариант в плане самой записи, что если делать так:

Код (Text):

struct Record

{

bool bIsAlive; // false - запись удалена, true - запись активна

int writeDateTime;

rec record; // данные по записи

uint32 nextRecordOffset; // смещение следующей записи, относительно текущей

uint32 prevRecordOffset; // аналогично смещение предыдущей записи, если понадобится канеш

}

это позволит восстанавливать удаленные записи, а так же хранить данные произвольной длины... однако канеш доступ к элементу в конце файла будет происходить через суммирование всех смещений, в этом существенный минус... еще пока не особо понятно, как сортировать такие записи, и как их отражать в память... но это уже другой вопрос, обсудим его позже...

t00x · 4 мар 2009

Код (Text):

struct Record

{

...

int writeDateTime;

...

}

это зачем?

_basmp_ · 5 мар 2009

t00x

это зачем?
Нажмите, чтобы раскрыть...

для поддержки многопользовательской/многопоточной работы.

в запросе на запись данных подается числодата считывания этой записи и если дата считывания раньше даты последнего изменения (записи), то записываться будет в конкурирующую запись во избежание утери данных. потом можно будет понаходить записи с конкурентами и поразруливать. в этом, например, причина разделения записи и шапки записи. ну и при считывании/записи ессно надо будет сигналить о наличии/появлении конкурентных записей.

Rel · 5 мар 2009

в запросе на запись данных подается числодата считывания этой записи и если дата считывания раньше даты последнего изменения (записи), то записываться будет в конкурирующую запись во избежание утери данных. потом можно будет понаходить записи с конкурентами и поразруливать. в этом, например, причина разделения записи и шапки записи. ну и при считывании/записи ессно надо будет сигналить о наличии/появлении конкурентных записей.
Нажмите, чтобы раскрыть...

можно канеш ограничиться флажком блокировки открытия элемента на запись... но с "числодата" канеш красивее, хоть и проблем в реализации больше....

Войти или зарегистрироваться

Программирование своей БД. Чтения/запись БД несколькими юзерами. (Си)

2FED New Member

_basmp_ New Member

2FED New Member

_basmp_ New Member

Rel Well-Known Member

_basmp_ New Member

Rel Well-Known Member

t00x New Member

_basmp_ New Member

Rel Well-Known Member

t00x New Member

Voodoo New Member

_basmp_ New Member

Rel Well-Known Member

Rel Well-Known Member

_basmp_ New Member

Rel Well-Known Member

t00x New Member

_basmp_ New Member

Rel Well-Known Member

Войти или зарегистрироваться

Программирование своей БД. Чтения/запись БД несколькими юзерами. (Си)

2FED New Member

_basmp_ New Member

2FED New Member

_basmp_ New Member

Rel Well-Known Member

_basmp_ New Member

Rel Well-Known Member

t00x New Member

_basmp_ New Member

Rel Well-Known Member

t00x New Member

Voodoo New Member

_basmp_ New Member

Rel Well-Known Member

Rel Well-Known Member

_basmp_ New Member

Rel Well-Known Member

t00x New Member

_basmp_ New Member

Rel Well-Known Member

Быстрый поиск