Скорее всего, вы уже слышали название MySQL — если вы создавали или поддерживали веб-сайты, или администрировали сервера под управлением Linux, или разрабатываете разное корпоративное ПО. Но если даже вы пока не знакомы с этим чрезвычайно мощным и удобным продуктом — не беда, далее мы расскажем все тонкости применения и работы с MySQL. итак, MySQL — это реляционная база данных (СУБД, система управления базами данных), распространяемая под лицензией OpenSource GPL (точнее — под двойной лицензией, для OpenSource программ она бесплатна, для коммерческого применения платная).
Давайте сперва на секунду отвлечемся и посмотрим, какие еще СУБД есть на рынке, ведь большинство крупных софтверных компаний имеет в своем арсенале базу данных. Наверное, первой, с которой вы познакомились, являлась Microsoft Access. Это типичный представитель «легких» баз данных, отлично подходящий для использования дома, для учета личных коллекций или на небольшом предприятии для автоматизации рутинной работы. Для более серьезных применений есть ее «старший брат» — Microsoft SQL Server — ему уже доступно практически все. С легкостью обрабатывая в считанные секунды базы данных объемом в сотни тысяч и миллионы строк (в таблицах могут быть сохранены разные данные, это значит, что каждый столбец таблицы может содержать произвольные данные — от простого номера до огромных текстовых массивов в единицы и десятки Мб). Еще к таким «тяжеловесам» относятся СУБД компании IBM — DB2 и Oracle одноименной компании. Поскольку практически все языки программирования, применяемые для создания веб-приложений, имеют встроенную поддержку этих баз, напрямую или через ODBC, то на основе таких «промышленных» СУБД в основном строятся корпоративные порталы и веб-сервисы, для которых критична нагрузка и требуется способность работать с большими объемами данных. К примеру, язык PHP может работать с Sybase, PostgreSQL, MS SQL Server, Oracle, Informix, InterBase, Ingres, а также с любыми другими базами через интерфейс ODBC.
Еще есть класс «средних» СУБД — как по цене, так и возможностями они отличаются от описанных выше. Это например, Borland Interbase, MS Access, PostgreSQL и особый предмет нашего разговора — MySQL. Эти базы довольно простые для обучения и программирования, дешевы или вовсе бесплатные и отлично подходят для создания различных приложений (как традиционных, так и веб) приложений, где не требуется космическая надежность и устойчивость.
MySQL не одинока на рынке:
Почему мы рассказываем вам именно о MySQL? Потому что она бесплатная (GPL OpenSource)? Не только. Потому что это очень небольшая по размерам СУБД (всего 25 — 30 Мб дистрибутива, в отличии от целого CD MS SQL Server или сотни полторы Мб MS Access)? Тоже нет. Потому что она очень быстрая (особенно на операциях чтения, когда дынные считываются с таблиц и выводятся в ответ на запрос клиента — именно поэтому БД стала популярна в среде интернета, где важна именно скорость чтения)? И это не самое главное. А может потому, что это очень динамично развивающийся продукт, результат работы сотен людей так называемой «виртуальной» компании MySQL AB (виртуальная она потому, что сотрудники не сидят в одном офисе, а раскиданы по всему свету и постоянно связаны только через сеть интернет)? Да, и это тоже, но не только. Если честно, я сам не возьмусь сказать, что привлекло меня именно в MySQL — просто однажды я попробовал поработать с ней и понял, что отныне все мои проекты любого масштаба будут использовать только эту СУБД — MySQL!
… но по ряду параметров лучшая!
Теперь, определившись с базой, можно загрузить с сайта www.mysql.com нужную нам версию СУБД. Тут надо остановиться и прояснить ситуацию с версиями. Сейчас существуют параллельно несколько версий MySQL:
стабильная — MySQL 3.23.xx (а теперь еще и ветка 4.1.хх). Эта версия протес
тирована многими и успешно работает на тысячах серверов, она рекомендована для применения в любых проектах;
бета — версия в разработке, рекомендована только для изучения и ознакомления с новыми функциями. Ранее все версии MySQL 4.xx.xx имели статус беты.
гамма — это следующая ступень после беты, означает, что СУБД проработала больше месяца без существенных (критических) сбоев. Ее можно, в принципе, смело применять, но разработчики предупреждают, что эта версия еще тестируется, и они не гарантируют, что она совершенна.
альфа — это только для истинных фанатов и разработчиков. Сейчас это MySQL 5.0.x. В альфа-версиях еще много ошибок, но уже можно пробовать и исследовать функции и возможности, которые появятся в следующих версиях.
Не знаю, как вы, я но сразу скачал себе версию 5.0.0 (еще альфа). За почти год экспериментов альфа-версия ни разу не подвела — все работает как часы. Может, разработчики излишне перестраховываются, но главное — что они очень хорошо работают, поэтому для ознакомления и работы можно использовать как бета-верии (ветка 5.х), так и недавно выпущенные версии MySQL 4.1.х. Для особо требовательных вариантов применения можно использовать давно проверенные и стабильные версии 3.23.х, если не требуются какие-то особые функции.
Сразу же советую скачать дополнительную программу для облегчения работы с базой — MySQL Administrator. Об этой утилите и других програмах, позволяющих существенно упростить работу с базой, мы уже писали — «Утилиты-администраторы сервера MySQL«.
Существует несколько параллельных веток разработки
инсталляция MySQL очень проста, практически все сводится к нажиманию кнопки «Далее». По умолчанию программа устанавливается в директорию «c:\mysql», хотя вы можете свободно изменить этот путь как в процессе установки, так и в любой момент просто скопировав всю дерикторию в другой каталог или диск. В общих чертах MySQL состоит из нескольких программ (они размещены в виде отдельных exe-файлов в каталоге «c:\maysql\bin», которые работают вместе. Подробнее о назначении каталогов и файлов в дистрибутиве MySQL говорится в статье «Каталоги и файлы сервера MySQL».
Сам сервер СУБД MySQL функционирует как отдельная программа. Непосредственно к нему вы не можете обратиться — для этого существуют специальные программы. Одной из них является терминал mysql — он принимает команды от пользователя и соеденившись с сервером MySQL (который может быть как на другом компьютере в локальной сети, так и на сервере в интернет-е, или же на том же компьютере — это не имеет значения, для вас как пользователя это совершенно прозрачно) отправляет их на исполнение, обратно принимая результат (например, выбранные данные из базы, или ответ сервера о успешном завершении указанной операции или сообщение об ошибке). Другие программы могут сами взаимодействовать с сервером напрямую, командный терминал нужен лишь для общения пользователя с сервером.
Кстати, сервер MySQL почти сразу показывает свое «не-Windows» происхождение — простого клика по исполняемому файлу mysqld-nt.exe недостаточно для запуска. Проще всего сначала запустить какую-либо графическую утилиту — MySQL Manager или MySQL Administrator и уже потом запускать или останавливать сервер. Дело в том, что для запуска/остановки сервера надо указать много разных параметров, и их запоминание и набор каждый раз из командной строки неудобен. раньше, когда не было утилит, надо было создавать ярлыки и присваивать им команды. Теперь управлять сервером стало гораздо проще. Но все же знание команд и опций для запуска сервера очень полезно — самые важные из команд описанны в статье «MySQL запустить — тоже надо уметь»
Вот теперь мы подошли к раздорожью. Поясню — в принципе, все пользователи СУБД (не только MySQL, но и любой другой) делятся на две категории:
разработчики приложений, которые используют СУБД для хранения и управления данными;
администраторы, которые настраивают и поддерживают работу сервера СУБД.
Для каждой из этих групп пользователей есть свои программы, каждая группа видит сервер MySQL в своем ракурсе и им нужны разные сведенья для работы. Конечно, разработчик прикладной программы должен ориентироваться в управлении сервером, но совсем не обязательно влезать в тонкости оптимизации или управления пользователями — для этого есть администраторы БД, которые в свою очередь практическ
и не вмешиваются в структуры таблиц, создаваемыми разработчиком, а только настраивают параметры сервера и следят за его работой.
Давайте попробуем кратко взглянуть на MySQL с позиции среднего пользователя, немного администратора и немного разработчика.
С точки зрения прикладного разработчика, работа с сервером MySQL заключается в том, что он подключается к серверу, открывает соединение с указанной базой и работает с таблицами в этой базе данных. Для работы ему необходимо знать параметры соединения с сервером (если сервер на том же компьютере, то это: host: localhost, port: 3306; login/password получается у администратора, по умолчанию это root с пустым паролем) и имя базы данных. Далее все взаимодействие с таблицами происходит через ввод и исполнение SQL-запросов и обработкой возвращенных результатов.
С точки зрения администратора СУБД это выглядит следующим образом. Он должен создать нового пользователя, разрешить ему работу с нужной базой данных, при необходимости установить права доступа к отдельным таблицам (и даже к отдельным столбцам!) и указать серверу, что конкретному пользователю можно подключаться к серверу или с любого компьютера (мы помним, что сервер и клиент MySQL могут быть как на одном компьютере, localhost, так и в любом месте локальной сети или интернет-а). Для этого администратор имеет свою служебную базу данных — mysql, в которой в отдельных таблицах хранятся все необходимые настройки. Подробнее о настройке прав доступа пользователей читайте в статье «Управление доступом к базам MySQL»
Обычный пользователь с этой служебной базой практически не имеет дела, он может работать только со своей базой, а для администратора наоборот — это практически повседневный рабочий инструмент.
инсталляция MySQL не сложнее любой другой программы
Что объединяет всех пользователей, работающих с СУБД (снова таки, не обязательно с MySQL) — это то, что основным языком общения с сервером является SQL — структурированный язык запросов. Существует несколько версий этого языка, MySQL пока поддерживает синтаксис ANSI SQL 92 с некоторыми ограничениями. Да, следует признать, что в СУБД MySQL пока не поддерживаются некоторые функции и возможности, которые определены в стандартах SQL или присутствуют в других СУБД (в том же Oracle или MS SQL Server). Но для этого есть причины — одни функции нужны только при разработке высокоустойчивых кластеров, другие существенно влияют на скорость или ресурсоемкость (разработчики MySQL всегда делали ставку на скорость работы, поэтому часто прямо говорили, что та или иная функция не включена, поскольку влияет на скорость). Поскольку долгое время, да и сейчас, одной из основных сфер применения MySQL является веб-разработка и поддержание динамических веб-сайтов, то такая позиция была оправданна и выгодная. Но, следуя общей тенденции, разработчики потихоньку сближают возможности «тяжелых» СУБД и MySQL — уже версия 5.0 (а начальная поддержка кластеризации внедрена уже в текущую версию 4.1), которая пока в стадии разработки, позволяет строить очень мощные отказоустойчивые сервера, а пакет MySQL Cluster позволит создавать сервера СУБД с надежностью 99,999% (время простоя 5 минут/год), что сразу же выводит MySQL на рынок серьезных корпоративных решений.
Отдельные решения из «тяжелых СУБД» после длительного тестирования попадают и в стабильные версии. Например, поддержка транзакций. Транзакция — это несколько последовательных запросов к БД, которые выполняются или все вместе, или не выполняются вообще. Если первый запрос вставляет данные в одну таблицу, второй в другую, а третий считывает все эти данные и обрабатывает их, то при использовании транзакций никогда не будет такой ситуации, когда данные в первую таблицу уже вставлены, а во вторую еще нет, а операция считывания уже исполняется и дает ложный результат. Если происходит ошибка на какой-либо отдельной операции в транзакции, то делается «откат», и данные остаются такими же, как и до исполнения транзакции. Но если вы используете сервер СУБД в режиме «по-умолчанию», вы даже не заметите новых функций — это существенно при переносе ПО и баз из предыдущих версий СУБД. Если вам действительно нужно использовать новые возможности — это делается вручную, через команды SQL или опции сервера. Например, поддержка транзакций введена через новый формат таблиц — InnoDB. По умолчанию используется привычный формат MyISAM, который универсальный для всех версий сервера (и платформ), а если надо получить доступ к новым возм
ожностям — пожалуйста, это делается заданием опций при создании таблицы (в операторе CREATE TABLE после описания полей новой таблицы пишется предложение TYPE=<тип таблицы>). Такой способ введение новшеств очень удобен — сохраняется обратная совместимость, а новые возможности применяются только тогда, когда они действительно нужны.
Теперь MySQL поддерживает кластеризацию
Еще надо сказать о типах данных, которые поддерживает MySQL. именно от этого зависит, какие данные сможет разработчик сохранять в базе. Конечно, присутствуют числовые данные — как целые числа (TINYINT, MEDIUMINT, INT, BIGINT), так и вещественные — (FLOAT, DOUBLE, DECIMAL). Для хранения строк применяются или типы CHAR и VARCHAR, длиной до 255 символов, или TEXT, MEDIMTEXT, LONGTEXT для хранения произвольных текстовых массивов. Для хранения двоичных данных используют те же типы — BLOB, MEDIUMBLOB, LONGBLOB — разница между ними в чувствительности к регистру символов и возможности полнотекстового поиска (он поддерживается для типов TEXT и производных). Для хранения даты и времени есть типы DATE, TIME, DATETIME, TIMESTAMP и YEAR. Для перечисляемых типов, значения которых заданы заранее, есть два варианта — SET и ENUM. Комбинируя в таблице поля указанных типов, а при необходимости применяя еще программную обработку данных можно сохранять и управлять практически любыми данными.
Вы все еще сомневаетесь, стоит ли применять СУБД MySQL в своих разработках? Смею заверить, она отлично справится с работой в качестве корпоративного сервера. Или вы считаете, что MySQL не выдержит нагрузки и для вашего приложения лучше купить более «тяжелую» СУБД типа MS SQL Server или Oracle? Попробуем вас переубедить.
Любой тип данных займет свое место в СУБД MySQL
MySQL реально поддерживает работу с большими базами данных. К примеру, размер таблицы может достигать 512 Гб (именно, Гигабайт). Конкретный размер таблицы определяется операционной системой, под управлением которой запущен сервер (таблица представлена одним файлом, поэтому ее максимальный размер ограничен возможностями файловой системы и ОС). Для платформы Intel (32-х разрядной) + Linux/Windows размер таблицы может достигать 4 Гб и более, а указанные 512 Гб можно получить, используя Sun Solaris на платформе UltraSPARC. Впечатляет? Отдельные клиенты MySQL AB рассказывали, что работают с базами данных, содержащими до 60 000 таблиц (!) в одной базе и до 5 миллиардов записей в таблице (!!). А теперь поддержка MySQL Cluster позволит поднять этот показатель еще выше. Более того, даже если ваша ОС или файловая система не поддерживает большие файлы, можно использовать данные, разнесенные на две и больше таблиц в режиме одной — несколько таблиц (физически размещенные в нескольких файлах) будут на уровне базы данных (в SQL-запросах) обрабатываться и отображаться как одна большая таблица.
MySQL поддерживает таблицы до 512 Гб и до 60 тыс. таблиц в базе
Я один раз из чистого любопытства сделал тест на своем компьютере (конфигурация: Intel Celeron 400, 320 RAM, Win2000 Pro Sp4, MySQL 4.01, сервер mysqld-nt-max.exe) — простенький скрипт обрабатывал данные в одной таблице — вставлял, потом сортировал, по нескольким критериям выбирал и переносил в другую таблицу, а потом удалял из исходной. И так в цикле. По статистике, у меня получилось обрабатывать до 285 запросов в секунду, при этом на компьютере можно было более-менее нормально параллельно работать в MS Office.