Как музыка стала свободной. Конец индустрии звукозаписи, технологический переворот и «нулевой пацие - Уитт Стивен - Страница 5
- Предыдущая
- 5/64
- Следующая
Первый. Цвикер доказал, что человеческое ухо лучше всего воспринимает определённый высотный диапазон, который примерно совпадает с человеческим голосом. За этими пределами — особенно выше — слух уже воспринимает хуже. То есть для записи краёв спектра можно использовать меньше бит.
Второй. Цвикер продемонстрировал, как близкие по высоте тоны уничтожают друг друга. Конкретно: нижний тон подавляет верхний, так что когда вы оцифровываете музыку с пересекающимися инструментами, например, виолончелью и скрипкой, играющими одновременно, то скрипку можно записать меньшим количеством бит.
Третий. Согласно опытам Цвикера, слух не воспринимает звук после громкого щелчка. Так что если вы оцифровываете музыку с, например, ударами по тарелке в каждом такте, то в первые миллисекунды после удара можно оставить меньше бит.
Четвёртый и самый странный. Ухо не воспринимает также и звук до громкого удара. Дело в том, что уху требуется несколько миллисекунд, чтобы обработать услышанный звук, и удар этот процесс прерывает. То есть, если снова говорить о тарелке, то нескольким миллисекундам до удара требуется меньше бит.
Основываясь на десятилетиях эмпирического исследования слуха, Бранденбург «объяснил» битам, куда им вставать. Но это был только первый шаг. Настоящее же серьёзное достижение Бранденбурга в том, что он понял, что это — итерационный процесс. Другими словами, можно взять то, что получилось в результате сжатия по его алгоритму, снова прогнать через тот же алгоритм и повторять так столько раз, сколько угодно, доведя файл до такого крошечного размера, который вам нужен. Качество звука при каждом таком прогоне, разумеется, ухудшается: это как копия копии или четвёртая перезапись на кассету. То есть если повторить процесс миллион раз, то у вас останется только один бит.
Но если найти нужный баланс, возможно и сжать, и сохранить качество, оставив лишь те биты, которые услышит человеческое ухо.
Конечно, не любой музыке требуется столь сложный инструментарий. У скрипичного концерта много психоакустической избыточности, а у скрипичного соло — нет. Если нет ударов тарелки, накладывающейся виолончели или верхнего регистра, то нечего упрощать: есть только чистый тон, и никуда не денешься. Но в таком случае Бранденбург мог перебросить результат своего сжатия в другой метод сжатия, совершенно отличный от его способа.
Этот метод, получивший название «кодировка Хаффмана», в 50-е разработал учёный-компьютерщик Дэвид Хаффман в институте MIT. Работая на заре информационной эпохи, Хаффман заметил, что желая сэкономить биты, надо искать паттерны, образцы, потому что они по определению повторяются. То есть не надо записывать все паттерны битами, можно сделать это один раз и потом, когда необходимо, возвращаться к этой записи. С точки зрения теории информации, это — прямо как скрипичное соло: вибрирующая струна, извлекающая предсказуемые повторяющиеся звуковые паттерны в воздухе.
Эти два метода дополнили друг друга идеально: алгоритм Бранденбурга хорош для сложных, накладывающихся друг на друга шумов, кодировка Хаффмана — для чистых простых тонов. Так объединились десятки лет исследований в области акустики и анатомии с базовыми принципами теории информации и высшей математикой.
К середине 1986 года Бранденбург даже написал простенькую компьютерную программу, демонстрировавшую его метод в работе. Это знаковое достижение в его карьере: проверенный метод сохранения аудиоданных даже при самом скудном «бюджете» битов. Бранденбургу был 31 год. Первый патент он получил ещё до защиты диссертации. Бранденбург (что довольно необычно для выпускника) очень интересовался актуальным потенциалом рынка. С такими мозгами ему было обеспечено место преподавателя на испытательном сроке, но научная деятельность его не интересовала. Он ещё в детстве зачитывался биографиями великих изобретателей и усвоил, что уметь самому что-то делать руками очень важно.
Бранденбург был изобретателем, как Белл и Эдисон, и эти его амбиции поощрялись. Дитер Зайтцер, сбежав от Цвикера, большую часть карьеры сделал в IBM, собирая патенты и развивая коммерческое чутьё. Своих выпускников он тоже направлял по этому пути. Как только он увидел прогресс Бранденбурга в исследованиях психоакустики, он выгнал его из университета в Институт интегральных схем общества Фраунгофера — недавно открытый баварский технологический инкубатор, где сам был наблюдателем.
Этот институт — подразделение Общества Фраунгофера, мощной, финансируемой государством организации с десятками кампусов по всей стране — немецкий ответ Лабораториям Белла. «Фраунгофер» распределял деньги налогоплательщиков по перспективным направлениям исследований в широком спектре академических дисциплин, а когда эти исследования давали какие-то конкретные результаты, он устанавливал коммерческие отношения с крупными компаниями-производителями. За долю от будущих доходов от идей Бранденбурга, Фраунгофер предлагал современные суперкомпьютеры, высококачественное акустическое оборудование, профессиональную экспертизу в области интеллектуальной собственности и квалифицированную рабочую силу.
Последнее было важно. Метод Бранденбурга был сложным и требовал одновременно проводить несколько математических операций. Вычислительные технологии 1980-х годов с подобными задачами едва справлялись, и алгоритмическая эффективность играла ключевую роль. Бранденбургу требовался виртуоз, эдакая суперзвезда под кофеином, которая переведёт математический аппарат уровня выпускника вуза в безупречный компьютерный код. Такой нашелся во Фраунгофере: 26-летнии программист по имени Бернхард Грилл.
Грилл был ростом ниже Бранденбурга и вел себя спокойнее. Лицо — широкое, приветливое, волосы — рыжеватые и длинные. Голос — громче, чем у Бранденбурга, и более страстный, но беседы с ним протекают естественнее. Ну, и шутки он тоже шутил, да. Несмешные, конечно, но уж всяко лучше бранден-бурговских.
Нетипичный инженер, в мире аудио Грилл выделялся. Его легко вообразить представителем другой профессии. У него в натуре было что-то расслабленное, шаткое — живи он в Америке, наверняка носил бы гавайские рубашки и сандалии. Может бьггь, дело в воспитании и среде.
У Бранденбурга отец тоже был профессором, да и почти все исследователи во Фраунгофере происходили из верхушки среднего класса, а отец Грилла работал на заводе. Для Бранденбурга университетское образование — это некая данность, нечто само собой разумеющееся, просто по праву рождения, но для Грилла это было очень серьёзным достижением.
Он по-своему бунтовал против этого типично немецкого положения дел. Он страстно любил музыку, в детстве начал учиться играть на трубе, а к подростковому возрасту занимался по шесть часов в день. В двадцать с небольшим он немного поиграл в профессиональном коллективе: свинговом бэнде из 9 человек. Когда стало ясно, какие финансовые перспективы у такой карьеры, он вернулся к инженерной профессии и, в конце концов, стал изучать компьютеры. Но музыка жила в его сердце — за годы он собрал гигантскую эклектичную коллекцию записей всяких мутных, неизвестных стилей. Ещё у него было хобби: паять колонки.
К Бранденбургу и Гриллу присоединились ещё четверо исследователей из Фраунгофера. Это Хайнц Герхойзер, руководивший институтской группой изучения аудио; Харальд Попп, специалист по «железу»; Эрнст Эберляйн, эксперт в обработке сигнала; Юрген Херре, выпускник, чьи математические таланты почти равнялись талантам Бранденбурга. Впоследствии они назвали себя «первой шестёркой».
Они начали работать в 1987 году, занявшись созданием коммерческого продукта на основе патента Бранденбурга. Группа определила два направления разработок. Первый: алгоритм сжатия Бранденбурга можно использовать для «потока» (стриминга) музыки — доставки её слушателю с сервера, что предвидел Зайтцер. Второй: алгоритм Бранденбурга для «хранения» музыки, то есть создания музыкальных файлов, которые хранятся на персональном компьютере пользователя. В любом случае размер имел значение, и ключевым тут было создание коэффициента сжатия 12 к 1.
- Предыдущая
- 5/64
- Следующая