Jak stworzyć softwarowy dekoder MP3/WMA na ARM do pracy magisterskiej?

Question

Chce coś takiego zrobić na pracę magisterską. Ma to być odtwarzacz mp3, ale programowy, nie sprzętowy np na VS1001. Czy ktoś coś takiego wykonał? Chodzi mi o jakiś gotowy kod czy procedury, na których mógłbym się wzorować. Nie widzi mi się poznawania kodowania mp3 od początku i pisanie tego...

shg · Answer

Projekt Helix: Intel Integrated Performance Primitives, da się ściągnąć ze strony Intela, ale gdzie to jest, to nie pamiętam. libmad: Trochę tu (między innymi link do implementacji odtwarzacza mp3 i chyba AAC na ARMie):

Jacek31 · Answer

Łał ambitny plan, zwarzywszy że dziś można kupić bez problemu CPU z zintegrowanym dekoderem MP3,WMA, JPEG sterownikami SD/MMC, HDD i USB. Wszystko co trzeba zrobić to podłączyć przetwornik C\A i oprogramować. Taka zabawka jest na stronie ATMELa, i to na rdzenieu 8051. Ten procek to AT85C51SND3B. Życze sukcesu, potrzebujesz mocnego procka, najlepiej do DSP.

Januszcz22 · Answer

Albo mnie wzrok myli albo znajomość obsługi google.pl zanika w naszym społeczeństwie, więc jeżeli naprawdę chodzi o odtwarzacz mp3 na ARM to warto spojrzeć na stronę: fajny projekt.

Myrek1 · Answer

Wiem, że jest w google, znalazłem to wcześniej. Ale pytałem czy ktoś ma takie coś działające. Do tego poczytałem i chyba nie zrobię takiej obsługi, jest to za trudne. Tu ludzie będący wyrafinowanymi programistami łamali sobie nad tym głowę, a co dopiero ja.
No to chyba pozostaje zrobienie tego na procku ze sprzętowym dekoderem mp3 lub na VS1001.
Nie uważacie, że będzie to za proste jak na pracę magisterską?

Klima · Answer

Nie, nie będzie za proste. Ale skoro masz takie wątpliwości, to może lepiej ograniczyć się w innym zakresie? Zrób dekoder na ARMie + DAC, a źródło danych i sterowanie uprość. Na przykład tylko karta SD, odczytywanie z kolejnych sektorów (choć FAT nie jest już aż takim wyzwaniem), a sterowanie np poprzez RS z komputera (tylko najprostsze - start, stop). I zero bajerów. Jak to będzie działać, to zastanowisz się, co jeszcze dodać. A magisterka już będzie.

Konto nie istnieje · Answer

Dawno temu rozkminiałem napisamie programowego ottwarzacza mp3. Mam już dużo rzeczy zrobionych. Zostało tylko podmienianie wartości słów kodowych Huffmana na odpowiadające im zakodowane ciągi bitów i na koniec dekwantyzacja, a to będzie proste. Jak chcesz i masz dużo czasu to mogę Ci pomóc.

upanie · Answer

Samo napisanie procedur dekodujacych mp3 może i by się załapało na pracę magisterską, ale to o czym piszesz (zrobienie odtwarzacza na VS1001 czy podobnych) to są kpiny a nie praca magisterska. To zwykła rzemieślnicza robota i nie ma w niej cienia własnej inwencji. Przykro mi ale taka jest moja opinia.
Natomiast co do procedur dekodowania strumienia mp3 to już był taki wątek i istnieje gotowy kod na ARM-a, który to zwie się helix. Nie trzeba być super programistą aby z niego skorzystać. Ja osobiście odpaliłem to na AT91SAM7S256 i potrzebowało 30 MHz na 320 kbps coby odtwarzać w czasie rzeczywistym. Zatem zostaje jeszcze całkiem sporo mocy procka na inne rzeczy.
Niemniej jednak wykorzystanie takiego, gotowego kodu to również za mało jak na pracę magisterską.
Moim zdaniem student kończący studia drugiego stopnia powinien w takiej pracy włożyć coś od siebie a nie tylko poskładać gotowe klocki.

Pozdrawiam.

Myrek1 · Answer

No właśnie mnie tez wydaję się to za proste itp. Ale patrząc po projektach u innych to i tak jest to dość trudna sprawa w porównaniu z nimi. Np jedna praca na 2 osoby ma temat: mikroprocesorowe sterowanie silnikiem krokowym. I to na dwie osoby!! To ja takie coś mam zrobić na zaliczenie laboratoriów, a co dopiero na prace magisterską.
Dlatego chciałem dodać coś więcej. Np korektor, pełne IDTAGi, jakieś animacje, analizator widma, sterowanie z PC itp.
Ale chyba i tak będzie to za łatwe i to mnie dręczy.
Co by można jeszcze dodać do takiego odtwarzacza?
Chcę coś zrobić na ARMie, żeby się go nauczyć. Nie interesuje mnie proste sterowanie silnikami itp z uC, tylko pełne wykorzystanie peryferii uC. W takim wypadku propozycje prac mi nie wystarczają i chcę coś sam wymyślić z elektroniki, mimo że jestem na automatyce.

Klima · Answer

To ja może zadam pytanie od drugiej strony: Czy możliwa jest sensowna realizacja KODERA MP3 (choćby bardzo ograniczona) na ARM-ie (ale takim 7 albo Cortexie, a nie 9)?

adamusx · Answer

Oczywiście ze jest możliwa i jak najbardziej sensowna Kolega januszcz22 podał nawet link do projektu odtwarzacza MP3/AAC na AT91SAM7S256 i obsługa kart SD/MMC:

pgp · Answer

Niektóre tematy prac mgr są śmieszne. Ale jeżeli ktoś chwyta lutownice w rękę dopiero na ostatnim roku studiów to potem wychodzi coś takiego . Może zrób odczyt i zapis (!?) wav-a ? Albo postaw jakiegoś linuxa na tym ARMie i daj coś z wielowątkowości.

Myrek1 · Answer

Wypraszam sobie taki teksty! Wielu z kolegów wybiera sobie naprawdę śmieszne tematy, ja chcę wybrać coś lepszego i ambitnego. Nie trzeba mnie od razu jechać, że coś jest za łatwe, bo sam to powiedziałem. Jak coś to czekam na konkretne pomysły a nie tylko na krytykę.Na zaliczenie głupiego, jednego przedmiotu wybrałem sobie filtr analogowy 8 rzędu na procku ATmega i mam zamiar go wykonać (choć prowadzący mówił, że ten temat jest raczej na pracę magisterską), więc nie jest mało ambitny.... Pytam bo chcę zrobić coś ambitnego i na poziomie. Ale widać, niektórym łatwiej jest podcinać skrzydła i wyrażać swoje mądrości.

Konto nie istnieje · Answer

Ja na zaliczenia też robię takie żeczy że wykładowcy robią wielkie oczy i mówią ze to na doktorat nawet albo na habilitację się nadaje.
A co dopiero na prace magisterską. Ludzie! Wy nie wiecie co się robi na studiach?
Nawet odtwarzanie wava z karty SD czy jakiejś takiej by przeszło spokojnie jako praca magisterska, bo trzeba by wszystko ładnie zaimplementować, zrobic jakieś ładne menu, dać jakiś dobry DAC.
A co dopiero odtwarzacz mp3!
Moge tylko powiedzieć że ten odtwarzacz mp3 to może być troche przesada jak na pracę magisterską. Ludzie robią naprawde godne porzałowania rzeczy, np: iluminofonię 3-kanałową (nawet na kilku tranzystorach). Albo jakieś inne proste urządzenia, np: przedwzmacniacze, zasilacze. Nie wiem jak to jest Ciebie na kierunku, ale coś mi się wydaje że to bardziej programistyczny kierunek jest, więć coś na mikrokontrolerach ludzie robia pewnie, ale badziewia pewnie też jest pełno.

No ale jak też jesteś kozak jak ja i już koniecznie chcesz żeby promotor na obronie zrobił wielkie oczy to nie bronię Ci. Jak chcesz dekoder mp3 to prosze bardzo.
A pozostali co się bez sensu odzywają to niech siędzą cicho albo coś konkretnie pomogą. Temat tego postu to :ODTWARZACZ MP3". A nie odradzanie go lub jechanie komuś po pomyśle pracy dyplomowej tylko po to żeby narobić sobie punktów!

Ja chętnie służę pommocą. Tak jak już mówiłem mam trochę nieskończonych kodów źródłowych którymi mogę się podzielić. A co do projektu Helix, to nie widzę problemu żeby z niego skorzystać. Przecież można z niego złapać tylko wazniejsze fragmenty kodu, trochę je przerobić ,a resztę z zrobic po swojemu.
I tak praca bedzie dużo ponad śregnią krajową. A promotor na bank się nie przyczepi, bo zapewne nawet nie słyszał o Helix-ie.
A nawet jak, to co? Nie wolno się wzorować na czymś?

Konto nie istnieje · Answer

A w ogóle wiesz na czym polega dekodowanie mp3?
Napiszę to tutaj. Jak nie Tobie to może komuś innemu się to przyda.
Sama cześć odpowiadająca za właściwą kompresję jest jak zwykle bardzo prosta. Chodzi mi o transformatę iMDCT, specjalną dekwantyzację i o dekodowanie Huffmana. Wszystko się niezwykle komplikuje tylko dlatego, że jest wiele wariantów ustawienia kompresji. Jest Single Channel, Stereo, Joint Stereo, Dual Channel. Jest wiele różnych przepływności bitowych. Są jeszcze różne warianty przesyłania jakichś współczynników skalowania i mnóstwo innych pierdołów.
Cały algorytm oprócz prostych procedur do dekodowania Huffmana, dekwantyzacji i transformaty iMDCT musi zawierać mnóstwo przełączników które będą odpowiednio sterowały obliczeniami.
I teraz jak się dekoduje:
Szukamy w pliku mp3 początku ramki. Zaczyna się ona specjalną sekwencja bitów. Jest to „1111 1111 1111”. Potem jest jeszcze 20 bitów które oznaczają rodzaj warstwy (I, II lub III), kodowanie stereo lub jego brak, przepływność bitową , częstotliwość próbkowania i inne rzeczy. Czyli cały nagłówek ma 32 bity (4 bajty).
Potem jest wsadzone CRC które se można sprawdzić jak się chce.
Potem przed właściwymi danymi jest jeszcze ogromna ilość danych które są najbardziej skomplikowane do wykorzystania. Dane są krótkie, po kilka bitów, ale jest ich kilkanaście.
Są tam powstawiane różne informacje o stopniach kompresji różnych współczynników skalowania i chyba czegoś tam jeszcze. Jest ich mnóstwo i każdy tyczy się czego innego. I w dodatku wystąpienie niektórych współczynników jest zależne od wystąpienia innych, albo bezpośrednio jest zaznaczone jakimś bitem. Czyli najprościej mówiąc trzeba uważać przy wczytywaniu tych współczynników bo niektórych po prostu nie ma.
I w zależności od tego które współczynniki są a których nie ma trzeba odpalić odpowiednią procedurę dekodującą. Możliwe że wystarczy jedna procedura dekodująca, ale wtedy trzeba będzie brakujące współczynniki poustawiać na jakieś domyślne wartości. Niektóre na 1, inne na 0 albo jakość tak. Jeszcze do tego nie doszedłem. I to jest moim zdaniem najtrudniejsze, bo wariantów wystąpienia lub nie wystąpienia współczynników jest bardzo dużo.
No i jak już uda nam się przez to przebrnąć to teraz jest już łatwo.
Po tych współczynnikach są zakodowane Huffmanem dane.
Dekodujemy za pomocą stałej tablicy, bo drzewo Huffmana jest stale. Chodzi mi o to że indexujemy tablicę wartościami które odczytamy z ramki mp3. To nie jest takie proste, bo indexy mogą mieć różne długości, ale i tak jest to dość proste do zrobienia. I jak to zrobimy to już prawie mamy współczynniki do transformaty iMDCT.
Teraz trzeba je zdekwantyzować. To też jest proste. Podstawiamy do jednego wzoru i liczymy. Oczywiście ten wzór musi uwzględniać brak niektórych współczynników skalowania albo musi to być kilka wzorów i wybieramy odpowiedni w zależności od tego których współczynników skalowania brakuje.
Jak to zrobimy to robimy jednowymiarową transformatę iMDCT. To dopiero jest łatwe, choć zasada działania transformaty iMDCT jest bardzo trudna do zrozumienia. Ale nikt nie musi jej rozumieć. Ważne że kod programu który ją realizuje jest krótki i łatwy do napisania.
Możliwe że jeszcze trzeba będzie skalować uzyskane po transformacie iMDCT próbki, ale do tego też jeszcze nie doszedłem.
I teraz w zależności od tego w jakim standardzie Stereo dźwięk był zakodowany obliczamy próbki dla obydwu kanałów. To też jest banalne. Są na to bardzo proste wzory. Jak dźwięk był mono to nic nie przeliczamy bo od razu mamy próbki monofoniczne.
I to w zasadzie tyle.
Teraz tylko odtwarzamy próbki z prędkością odtwarzania taką jaka była podana w nagłówku ramki.
Oczywiście jedna ramka zawiera tylko kilka milisekund dźwięku. Ramek w pliku o długości powiedzmy 3 minuty będzie więc kilkanaście tysięcy. I każdą następną ramkę trzeba zakończyć dekodować zanim zakończy się odtwarzanie próbek z poprzedniej ramki. To już chyba oczywiste.
Jeszcze tylko jest jeden problem, mianowicie to że nie wszystkie dane do dekodowania Huffmana muszą być w jednej ramce. Jak się nie zmieszczą to mogą być w poprzedniej lub w następnej. Gdzieś w ramce jest zapisane czy są wszystkie w tej ramce, czy trochę jest w innych i oczywiście wtedy jest jeszcze wskaźnik do tych danych.
Ale się rozpisałem. I pewnie jest tu dużo błędów. Wszystko napisałem tak po swojemu tak jak to zrozumiałem ze specyfikacji 11172-3.
Mam tą specyfikację w piku pdf. Niestety nie pamiętam skąd to ściągnąłem więc nie dam linka. A jak to umieszczę na elektrodzie to jakiś moderator mi pojedzie że to jest w necie i nie powinienem tego umieszczać na elektrodzie. Niestety w tym pliku brakuje tabel do dekodowania Huffmana (brakuje stron. W spisie treści to jest).

piotrkopec · Answer

Świetny post 'atom1477'. Plik możesz uploadować na www.rapidshare.de www.megaupload.com www.share.am www.load.to i pewnie jeszcze w kilku miejscach

Myrek1 · Answer

@atom1477
Dzięki za rady. Dobrze piszesz z tymi tematami. Jakbym chciał to bym sobie wybrał jakąś łatwą, zaproponowaną przez dr ale ja chcę zrobić coś co mnie ucieszy, co będzie lepsze niż innych i co sprawia mi przyjemność. A programowanie do takich rzeczy należy. Ja jestem na Elektrotechnice, specjałka: automatyka, profil dyplomowania: komputerowe systemy sterowania.

Jeśli chodzi o mp3 to oczywiście, że chce do tego zrobić LCD kolorowy, pełne IDTAGi, korektor, analizator widma. Po prostu to co jest w winampie czy IPODach. Więc jak firmy sprzedają takie rzeczy za grube pieniądze, to jeśli ja to zrobię w domu to chyba nie będzie takie trywialne

Skontaktuje się z promotorem i zaproponuje mu mp3, zobaczymy co powie. W sumie to mało ma wspólnego z automatyką, ale zobaczymy.

Jeśli będę to robił to na bank zagłębię się w sam algorytm. MP3 jest trochę wyjaśnione w książce „Cyfrowe Przetwarzanie Sygnałów” Pana Zielińskiego.

Konto nie istnieje · Answer

Masz już jakiś pomysł jaki procesor zastosować? A jaki przetwornik DAC?

Myrek1 · Answer

Na razie myślałem nad projektem. Jeśli promotor go zatwierdzi to zabieram się za kompletowanie sprzętu i zbieranie informacji. Jeszcze na 100% nie wiadomo czy będę to robił.

Obecnie podobają mi się procki ARM z rdzeniem Cortex-M3, nad takim myślę. Może jakiś Stellaris z LM

EDIT:
Poprawiłem błąd

Konto nie istnieje · Answer

Znalazłem linka to tej dokumentacji! Był w jednym z moich starych postów.

Jak stworzyć softwarowy dekoder MP3/WMA na ARM do pracy magisterskiej?

Post #1

Post #2

Post #3

Post #4

Post #5

Post #6

Post #7

Post #8

Post #9

Post #10

Post #11

Post #12

Post #13

Post #14

Post #15

Post #16

Post #17

Post #18

Post #19

Post #20

Post #21

Podsumowanie tematu