Kompilacja kodu z FPU na Cortex-M4 w GCC – ustawienia Makefile i toolchain Linaro

Question

Próbuję ogarnąć używanie FPU z rdzenia Cortex-M4 w GCC. 1. Mam toolchain linaro, multilib: 2. W Makefile dodaję: -mcpu=cortex-m4 -mthumb -mfloat-abi=hard -mfpu=fpv4-sp-d16 do kompilatora i linkera 3. W kodzie włączanie koprocesora 4. Jest jakiś prosty kod: No i teraz na czym polega problem: a....

gaskoin · Accepted Answer

No to pozostało Ci jeszcze: -ffast-math. Opis brzmi groźnie: ale generuje taki kod bez optymalizacji: Kod: textZaloguj się, aby zobaczyć kod taki z 0s: Kod: textZaloguj się, aby zobaczyć kod i taki z O3: Kod: textZaloguj się, aby zobaczyć kod Więc wygląda to w miarę sensownie. Linker nie dorzuca też floating pointa więc całość zamiast 5 kb zajmuje 600b

gaskoin · Accepted Answer

Nie widzę żadnych przeciwwskazań. Ta flaga optymalizatora nie powinna sprawiać jakichś większych problemów. Możesz sprawdzić, czy sinus cosinus i inne bajery generowane softwarowo będą wyglądały poprawnie. Jeżeli tak, to tędy droga.

Btw flagę -fsingle-precision-constant i tak warto zostawić.

gaskoin · Answer

A zobacz jak będzie wyglądał assembler z flagą -fsingle-precision-constant

Freddie Chopin · Answer

Bez żadnych zmian - nawet pół bitu się nie zmienia w kodzie wynikowym.

Nie kumam tego totalnie... Konfiguracja multiliba wydaje mi się dobra, biblioteki są wybrane dobre, ale tak jakby te biblioteki były totalnie do niczego...

4\/3!!

gaskoin · Answer

A mógłbyś wrzucić cały projekt ? Czy z jakichś względów niebardzo?

Freddie Chopin · Answer

Jedyny wzgląd, który może w tym przeszkadzać to fakt, że jest to generalnie sieczka na tym etapie Przypuszczam że problemem mogą być agresywne optymizacje... Kod w postaci powyżej generuje bzdurny listing (nie używa instrkcji vsqrt.f32), natomiast jak tylko wywalę tą pętlę opóźniającą ze środka while(1) to nagle kod jest sensowny (poza tym wywołaniem sqrtf() jeśli wynik jest 0). Jeśli np dam obliczanie sqrtf() w pętli, to wynik też jest sensowny (z uwagą j.w.)... Dziwne trochę... Może po prostu funkcje biblioteczne nie dają rady w przypadku FPU i trzeba korzystać z funkcji z nagłówka arm_math.h? 4\/3!!

Freddie Chopin · Answer

A w tym ostatnim to nie odparowało jedno mnożenie? 4\/3!!

gaskoin · Answer

w lss pierwiastek był pocięty na kawałki, post edytowałem Najpierw rozpoczynał mnożenie, w między czasie rozpoczynał sobie whila i dokończył pierwiastkowanie. W większości przypadków kod wygląda więc tak samo.

Freddie Chopin · Answer

Hmmm... No to teraz pozostaje wielkie pytanie czy używanie tej opcji jest tą drogą którą należy podążać? 4\/3!!

Freddie Chopin · Answer

Poexperymentujemy w weekend

gaskoin · Answer

Czekam na wyniki. Najwyżej będziemy szukać dalej Niebawem powinna być przesyłka z CM4 więc będę mógł też sam sprawdzić.

Konto nie istnieje · Answer

Jakoś zawsze unikam floatów jak mogę, więc nie wiem czy to co powiem mądre będzie, ale spróbuję. Co do cytatu to widzę to zupełnie inaczej. Zważywszy że: Czyli: - musimy w programie zrezygnować z użycia ERRNO do kontroli operacji zmiennoprzecinkowych - musimy samodzielnie zapewnić, że argumenty funkcji zmiennoprzecinkowych będą poprawne i jeszcze kilka drobnych, które można wywnioskować z A przyczyna? Mi wygląda, że libm trzeba z jakiegoś innego źródełka zassać lub samemu napisać ;-( Albert PS. Poślij to na lpc2000 a prośbę o kometarz do Paula Curtisa

gaskoin · Answer

Ale przecież opcja -fno-math-errno sprawia, że flaga ERRNO nie jest ustawiana dla tych funkcji matematycznych, które są wywoływane jedną instrukcją, tak jak na przykład pierwiastek, mnożenie dzielenie etc. Dla funkcji które wymagają litanii assemblerowej ERRNO i tak jest ustawiane. Miało by to znaczenie, jeśli funkcje w libm wykorzystywały by mnożenia sprzętowe, ale tak nie jest. unsafe-math-optimalizations - dla hw floating point nie ma to znaczenia, dla soft trzeba by sprawdzić jak napisałem wyżej czy się nic nie sypie. Jest to tylko sprawdzanie argumentów funkcji, można się martwić o to samemu. -ffinite-math-only - tym się nie ma co martwić bo ta flaga i tak jest ustawiana domyślnie. -fno-rounding-math - j/w -fno-signaling-nans - j/w -fno-signaling-nans - to ma znaczenie przy mnożeniu/dzieleniu liczb zespolonych, ale i tak mamy tylko finite-math więc trochę nie kapuje co ta flaga jeszcze dodatkowo robi Dla bezpieczeństwa można ustawić więc samo -fno-math-errno, ale nie sądzę, żeby -ffast-math cokolwiek mógł bardzo popsuć -- Ciekawe co STM powie na pierwiastek z liczbą ujemną ? No i czy przypadkiem errno nie ma znaczenia tylko na OS ?

Konto nie istnieje · Answer

Być może. Ekspertem, jak pisałem nie jestem. Ale skąd się ta litania bierze? To przecież sekwencja pojedynczych instrukcji. Bez wglądu w źródełka libm (czyli tej litanii) lub potwierdzenia wiarygodnym linkiem bałbym się Twoje stwierdzenie stosować. Głównie sprawdzanie argumentów. Ale nie jestem takim optymistą jak Ty, że to zadanie trywialne. Przy bibliotekach wykraczamy poza argumenty. ??? - chyba źle doczytałeś. Skąd żeś coś takiego wziął? Ale fakt, tu jest standardowe ustawienie. Z -ffast-math czy bez ? Ma takie znaczenie jakie jest zdefiniowane w używanym libm. OS nie ma tu nic do rzeczy. Albert

gaskoin · Answer

albercie drogi, czy nawet i najdroższy, wszystko wziąłem z manuala gcc linka chyba nie muszę dawać bo sam go wkleiłeś. No dobra ale po kolei: ale tu chodzi o całą funkcję matematyczną. VSQRT zrobi Ci sprzętowy pierwiastek, ale nijak nie zrobisz już jedną instrukcją sinusa. Jest to napisane w manualu do gcc. Nawet jak wykroczymy z kontrolą błędów to i tak wszystko szlag trafi Tak, jest na odwrót zawsze coś powalę, ale raczej i tak nikt nie używa nieskończoności w uC. Z manuala do gcc. Tak to jest jak się edytuje swój post w locie ta flaga służy do nie-wskazywania NaN (not a number) przy jakichś błędach. Jest standardowe ustawienie, bo -fsignaling-nans jest narazie eksperymentalne (też o tym pisze w manualu). To, do czego się odnosiłem to flaga -fcx-limited-range, którą zjadło za to w opisie posta. Z i bez. A użyłeś kiedykolwiek flagi ERRNO ?

Konto nie istnieje · Answer

Fajnie że mnie tak lubisz Tylko naucz się jeszcze odróżniać kompilator od jego bibliotek. Funkcja sinus nie jest częścią składową kompilatora. Jest częścią standardowej biblioteki matematycznej. A tą możesz sobie zmienić pracując na tym samym kompilatorze. I w związku z tym do takowej nie możesz odnosić manuala gcc. Nie łapię. Ja w wielu wypadkach nie potrafię przewidzieć, jakie dane pojawią się w trakcie pracy mojego programu. Tak więc zazdroszczę. Tak. Albert

gaskoin · Answer

Wtedy będę mógł bardziej? Sprawiasz wrażenie, jakbyś bardzo chciał, aby nie było to rozwiązaniem A tak poważnie, to dla Twojej informacji - to ta opcja akurat ma związek z wywoływaniem właśnie funkcji bibliotecznych a sinus jest właśnie jedną z takich funkcji. Tylko szkoda, że manual gcc w przypadku tej flagi mówi wprost o bibliotece matematycznej. Ma to sens, ponieważ o ile funkcja ustawi Ci flagę, to sprzęt nie ma fizycznie możliwości aby to zrobić. Nie chcę się tu kłócić w nieskończoność, wolałbym to sprawdzić, co będę miał fizycznie możliwość zrobić w tym tygodniu. Chyba, że Freddie już to zrobił. Btw nie rozumiem trochę ataku z Twojej strony. Najpierw łagodnie, że nie jesteś ekspertam etc, a tu nagle walisz, że nie znam podstawowych różnic, że wszystko źle nie dobrze itd.

Freddie Chopin · Answer

Nie bardzo mam pomysł jak to sprawdzić [; Podać do funkcji jedno-rozkazowych jakieś jednoznacznie błędne dane (pierwiastek z liczby ujemnej) i zobaczyć co się stanie? 4\/3!!

Konto nie istnieje · Answer

Jeśli odebrałeś cokolwiek jako atak z mojej strony to przepraszam, nie miałem takiego zamiaru.
Potwierdzam, że nie jestem ekspertem i to co piszę to moja interpretacja, być może błędna.
Nie mam nic przeciwko temu, aby ktoś -ffast-math używał. Ja gdybym miał to zrobić chciałbym wcześniej rozwiązać problemy, o których piszę. Inaczej miałbym świadomość, że moja praca może być o kant .. rozbić.
Moim zdaniem z przyczyn, które napisałem nie można manuala do gcc w ten sposób interpretować.
Manual mówi, że funkcje pojedyncze - bezpośrednio tłumaczone na rozkazy nie ustawiają flagi. Nic nie mówi o innych, gdyż to zależy od libm więc nie może nic mówić.
Naprawdę twórcy gcc nigdzie nie zakładają, że użyjesz newlib jak pewnie jest w przypadku Freddiego.
Poza tym myślę, że akurat Freddie też umie manuale czytać i wyciągnie swoje wnioski, niezależnie od tego jak bardzo ja i Ty byśmy się starali.
A dyskusję prowadzę, bo miałem nadzieję, że wiesz coś więcej i się podzielisz.

Albert

gaskoin · Answer

To niestety też tylko interpretacje.

Mogę się z Tobą zgodzić co do tych wszystkich kontroli argumentów, zakresów itd. Ale używając sprzętu, nie możesz w żaden sposób takiej kontroli zapewnić. To może być albo zależne od samego liba, albo sam sobie musisz zapewnić taką kontrolę. Kontrola taka jest pewnie zapewniana przez wywołanie softwarowej obsługi i olanie FPU, czyli tak jak mówisz - lib jeszcze być może kuleje. Ale to tylko domysły wzięte z opisu opcji -fno-math-errno która jak jest napisane w manualu nie ustawia flagi po jednorozkazowych funkcjach.

Co ciekawe dla instrukcji VSQRT w manualu CM4 jest "no restrictions" więc jestem ciekawy co on wypluje dla np -5.1234. Wartość bezwzględną, Hard fault, Wybuchnie, spłonie ? Kto odważny spróbuje? Ponoć zero zwróci taki pierwiastek.

Konto nie istnieje · Answer

I tym się nasze podejście różni. Mnie to zupełnie nie ciekawi.
W takim wypadku platforma na którą piszę
(obojętnie czy sprzęt, czy biblioteka) ma mi dać informację, obojętnie w jaki sposób
(errno, trap, callback, czy cokolwiek innego), że wynik jest bezużyteczny.
Mając takie sprzężenie dalej sobie poradzę. Natomiast gdy go nie mam
to cały zmienny przecinek jest bezużyteczny (obojętnie czy sprzętowy czy programowy)
I jego szybkość jest już co najwyżej sprawą drugorzędną.
I ten tok rozumowania przenoszę na opcję -ffast-math, stąd moje krytyczne podejście do niej.

I potrafię pojąć, ze moje podejście jest dziwne dla np grafika, dla którego parę artefaktów na parę milionów punktów to żaden problem. Ale ja wolę w niebo słać rakiety. ;-)

Albert

Freddie Chopin · Answer

No to zawsze jest nagłówek arm_math.h, a w nim np ten inkryminowany pierwiastek:

Zaloguj się, aby zobaczyć kod

Wg tego - http://infocenter.arm.com/help/topic/com.arm.doc.ddi0439c/Chdbebfc.html - nie jest też tak źle. Przypuszczam że można sobie aktywować przerwanie od błędu matematycznego i po problemie z flagą errno. W ARMv7-M ARM znalazłem opis bitów statusowych, które spokojnie zastąpią flagę errno, szukam jeszcze czegoś o przerwaniu, ale pewnie to też da się odpalić.

4\/3!!

Promuję tematy:
07.03.2015 [C++11][Cortex-M3/M4] - distortos - obiektowy RTOS dla mikrokontrolerów w C++
10.02.2013 bleeding-edge-toolchain - kolejny toolchain dla ARM

gaskoin · Answer

W PM0214 są opisane jakieś rejestry statusowe dla FPU i jakieś przykładowe handlingi. Też mi się wierzyć nie chce, żeby zostawili gołe działania i hulaj dusza. W takim razie może i ja poślę rakietę w niebo i przestanę rysować w paincie ?

Freddie Chopin · Answer

No są takie wyjątki dostępne w rejestrze FPSCR Nie mogę jednak nigdzie znaleźć informacji od czego jest to ostatnie przerwanie w STM32F4 - FPU global interrupt. Czy wystarczy je tylko włączyć w NVIC i już powyższe wyjątki generują przerwanie, czy coś innego? EDIT: w tym manualu który przywołałeś powyżej jest co trzeba: Czyli nawet jest sprzętowe przerwanie - lepsze to chyba niż errno

Kompilacja kodu z FPU na Cortex-M4 w GCC – ustawienia Makefile i toolchain Linaro

Post #1

Post #2

Post #3

Post #4

Post #5

Post #6

Post #7

Post #8

Post #9

Post #10

Post #11

Post #12

Post #13

Post #14

Post #15

Post #16

Post #17

Post #18

Post #19

Post #20

Post #21

Post #22

Post #23

Post #24

Post #25

Podsumowanie tematu