Dlaczego układ w ISE nie działa mimo poprawnej analizy czasowej?

Question

Witam, dotarłem do etapu pracy, w której przeprowadziłem analizę czasową. Niestety jak to zwykle bywa układ nie działa tak jak powinien. Ustawiłem ograniczenie globalne dla linii zegarowej, po wielu zmianach układ udało mi się tak dopasować aby ISE nie zwracało błędu 'time constrain validation'....

J.A · Accepted Answer

pndemon:
> zrobiłem dokładnie tak:
/.../
> - zacząłem testować model post-place-and-route i nie jest ok

co jest wskaznikiem, ze nie jest ok ?
widzisz na wyjsciowych pinach danych, ze powinna byc wartosc
'X', a jest 'Y' ?
masz jakis uklad, ktory rozpoznaje blad i zapala jakis rejestr ?

pndemon:
> licznik_a<=tablica(adres_a)
> licznik_b<=tablica(adres_b)
> -niestety nie działało(tzn. tylko podczas post-place-and-route),
> pojawiały się sygnału typu X

przychodza mi do glowy dwie przyczyny x-ow;
- odczytujesz adres, ktory jeszcze nie zostal zapisany;
[ew. odczytujesz w momencie zapisu]
- ktorys z sygnalow sterujacych pamiecia
[chip_select, write_enable, output_enable, etc] jest 'x';

jesli jeszcze masz zamiar drazyc ten temat, to stosunkowo
latwo powinno byc znalezc, ktory sygnal 'iksuje' jako pierwszy
i powoduje iksy na danych;

roznica w wynikach symulacji funkcjonalnej i czasowej
moze wynikac stad, ze w testbench napisales, iz dane
i clock zmieniaja sie w tym samym czasie Tx, dla analizy
funkcjonalnej jest to ok, dla symulatora post_place&route nie;
jesli tak jest, to przesun dane o kilka ns. w stosunku do clock;

JA

J.A · Answer

ise znam bardzo slabo, musialem pracowac z tym programem przez pol roku po czym, z ulga, wrocilem do quartusa, ale sadze, ze opisany tu problem nie zalezy za bardzo od srodowiska; piszesz, ze cos jest zle, ale nie podajesz zadnych informacji co, wiec by ci cokolwiek doradzic czy zasugerowac trzeba by chyba miec krysztalowa kule; tez tak to rozumiem pod warunkiem, ze twoj algorytm jest poprawny; slusznie; obawiam sie, ze nikt ci nic nie podpowie, jesli nie opiszesz owych bledow quartus tak robi i jestem swiecie przekonany, ze ise nie jest w tym punkcie gorszy; nie widze wiekszych problemow z przetestowaniem w fpga modulu, ktory jest fragmentem wiekszej calosci; w koncu kazdy modul moze byc samodzielnym projektem, a kazda wieksza calosc moze byc modulem super-calosci; J.A

sepher · Answer

Jeśli analizowałeś pracę układu przy jakiejś wyższej częstotliwości (np. zbliżonej do tej, z którą ma działać na płytce), to spróbuj obniżyć dla celów testów częstotliwość zegara i zobacz czy w tym przypadku wszystko zadziała. Jeśli nie, to znaczy, że błąd raczej nie jest spowodowany opóźnieniami wprowadzanymi przez logikę. Jeśli tak, to w raportach generowanych przez ISE możesz podejrzeć która ścieżka między wejściem i wyjściem wprowadza największe opóźnienie, łącznie z podziałem na etapy, a także zobaczyć, które sygnały naruszają wprowadzone przez Ciebie ograniczenia (constraints). To jest dobre miejsce, aby zacząć szukanie rzeczy, które można w projekcie poprawić.

pndemon · Answer

Błędem jest to ze nie działa tak jak powinien

, tzn. uznałem ze opisywanie to co nie działa jest nieistotne, po prostu układ przetwarza ale nie tak jak powinien, pojawiają się błędne dane, których nie powinno być, inaczej mówiąc zmienia się funkcjonalność.

Co do testowania z osobna modułów programu, to jakoś tak sceptycznie podchodzę. Nie robiłem nigdy tak, a wydaje mi się, ze jak zmapuję tylko pojedynczy moduł to przeciez jego struktura będzie zupełnie inna nić w połączeniu z resztą układów, chyba zeby zmusić router do umieszczenia tego dokładnie tak samo na matrycy, ale nie bardzo nawet wiem jak.

Mimo wszystko dzięki za rady i spróbuję tak jak pisałeś, bo i tak nic innego mi nie przychodzi, do głowy. Jedna tylko pozostaje rzecz, otóz gdybym wiedział co moze powodować zmianę zachowania układu, moze udało by mi się zawęzyć krąg poszukiwań.

Cytat:
Jeśli analizowałeś pracę układu przy jakiejś wyższej częstotliwości

Jedyne ograniczenia jakie wprowadzałem to częstotliwość pracy układu, dałem 100 MHz i raport z TRACE'a wygląda tak:

Timing constraint: TS_clk = PERIOD TIMEGRP "clk" 100 MHz HIGH 50%;

 54973 items analyzed, 0 timing errors detected. (0 setup errors, 0 hold errors)
 Minimum period is   9.974ns.

No nie jest za dobrze, błąd nie zależy od częstotliwości pracy, a co mnie bardziej martwi, to że układ zwraca kod błędu i z tego wnioskuję, że automat nie znajduje się w tym stanie co powinien. Błędy zależą jedynie od rodzaju danych jakie wchodzą do układu. tzn część danych określa sposób przetwarzania układu, jeśli one ulegają zmianie to błędy pojawiają się w innych miejscach, ale w obrębie jedne rodzaju danych, częstotliwość nie ma znaczenia, tzn. testowałem dla 50 MHz i dla 10 MHz, wynik jest taki sam.

Największy problem, to to że ISE przestawia mi nazwy wszystkich sygnałów, i nie bardzo wiem, jak je później odłowić z tych tysięcy w pliku do symulacji post_place_and_route. Może istnieje jakaś metoda na to?

griva · Answer

masz jedna domene zgarowa? masz internalne clocki? automaty sa zrobione z opcja safe? nie mozesz podgladnac stanu automatu? sciagnij sobie evalucayjna wersje chipscopa i bedzie wszystko jasne.

J.A · Answer

innymi slowy oczekujesz od dobrych dusz usilujacych pomoc wrozenia z fusow; blad moze byc wynikiem wynikiem blednie zakodowanego algorytmu, problemow czasowych, przyjeciem niewlasciwych zalozen co do sekwencji wejsc; jesli projekt jest bardziej skomplikowany niz prosty automat czy licznik, to masz najprawdopodobniej do czynienia z polaczonym efektem kilku bledow na raz; im wiecej tych bledow, tym trudniejszy proces odpluskwiania; dlatego najpierw weryfikuje sie kazdy modul z osobna i nie ma znaczenia, jak pozniej zostanie rozmieszczona logika, przeciez ten twoj uklad nie moze dzialac tylko i wylacznie w jednym konkretnym rozlozeniu bramek i rejestrow; no coz, /fusy_mode ON no to skompiluj sam automat i testuj go mozliwymi stanami wejsc; jedna z przyczyn opisanego przez ciebie zachowania moze byc takie zakodowanie FSM: jesli A to FSM = X1 jesli B to FSM = X2 tymczasem na wejsciu pojawia sie i A i B, wiec FSM idzie do jakiegos nieprzewidzianego stanu X1&X2 a potem juz calkiem w maliny; moze RTL nie jest przygotowany na zmiane sposobu przetwazania danych w dowolnym momencie, a jedynie gdy jest w konkretnym stanie ? /fusy_mode OFF powodzenia w debuggowaniu J.A

pndemon · Answer

no nie zupełnie, po prostu stanąłem, przed faktem, że opis funkcjonalny działa dobrze, najdłuższa ścieżka ma poniżej 10 ns, stąd wnioskowałem że jeśli odpalę symulację na częstotliwości mniejszej niż 100 MHz to powinno działać, a ponieważ tak się nie dzieje, to uważam że ISE zrobił z mojego opisu nie to co sądziłem, że zrobi. Największy jednak problem jaki mnie gnębi to, fakt że nie wiem jak analizować symulację modeli, które zostały wygenerowane po place-and-route. Z każdego mojego sygnału robi się 200 innych i nawet nie wiem, za co one odpowiadają, myślałem, że może jest jakiś sposób na odnalezienie się w tym gąszczu. nie bardzo jestem w stanie sobie wyobrazić jakie to problemy czasowe mogą się pojawić, skoro timing analizer uznał że pomiędzy dwoma sąsiednimi rejestrami najdłuższa ścieżka nie przekracza 10 ns no w każdym razie będe jak już mówiłem, próbować posymulować wszystko oddzielnie. dzięki za wytrwałość

J.A · Answer

to byla uwaga uzasadniajaca, dlaczego warto przetestowac mniejsze kawalki, zanim sie zabierzesz za sprawdzanie calosci; walczysz wtedy z mniejsza iloscia wrogow na raz; cos mi umknelo, skad wiesz, ze opis funkcjonalny dziala dobrze ? sama symulacja - twoja znajomosc ise jest chyba niewiele wieksza niz moja musisz poswiecic godzine na przeczytanie manuala, nie wierze, ze w symulatorze nie ma jakiegos filtra pozwalajacego latwo wybrac do wyswietlenia interesujace cie sygnaly; inna sprawa, ze w trakcie kompilacji sygnaly moga zmieniac nazwy, ale to zwykle oznacza dodanie do nazwy z rtl jakiejs koncowki i dotyczy logiki kombinacyjnej, rejestry powinny zostac nieruszone; jesli ktores linie sa dla ciebie wazne, a nie mozesz ich znalezc mozesz takie sygnaly polaczyc do top level pinow, nie zostania usuniete i latwo bedzie je znalezc; J.A

pndemon · Answer

no z tego co ja wiem to w ISE najpierw testuje się opis behawioralny, oczywiście taki, który da się zsyntetyzować, a dopiero potem tzw. post-place-and-route, czyli model zależności czasowych. z tego co udało mi się na razie ustalić, to raczej chodzi o problemy wynikające z tego, że myślałem, iż syntezer się domyśli czegoś z mojego opisu, ale tak się nie stało, przykładowo miałem tablicę, do której mają prawo odczytu dwa procesy, myślałem, że zostanie ona stworzona jako pamięć dwuportowa, albo po prostu syntezer zdubluje tą tablicę dla każdego procesu oddzielnie, teraz wiem że coś tu nie działa, więc przebudowuje tego typu konstrukcje

J.A · Answer

co to znaczy: w ISE najpierw testuje się opis behawioralny zakladasz, ze ise samo cos testuje ? zrobiles symulacje funkcjonalna RTL i bylo ok ? jesli symulacja funkcjonalna jest w porzadku, post-place&route nie, to faktycznie masz problem z timingiem, ale wtedy chyba dosc latwo jest porownac wynik obu symulacji z znalezc przynajmniej miejsce w ktorym cos szwankuje; pndemon: > przykładowo miałem tablicę, do której mają prawo odczytu dwa procesy wczesniej programowales procesorki, prawda ? pndemon: > myślałem, że zostanie ona stworzona jako pamięć dwuportowa jesli ja napiszesz tak jak trzeba, to kompilator sie domysli, ze chodzi o dual-port memory; jesli sie nie domyslil - zle napisane; w ise mozesz uzyc core generator ktory stworzy dla ciebie dual-port memory o zadanych parametrach [glebokosc i dlugosc slowa] pndemon: > albo po prostu syntezer zdubluje tą tablicę dla każdego procesu > oddzielnie tego nie rozumiem nijak nie potrafie wymyslic przykladu, w ktorym 2-portowa pamiec mozna zastapic 2 pamieciami; chyba ze zle pojalem od poczatku, nie chodzi o 2-port RAM, przez ktory procesy wymieniaja dane, a o ROM z jakimis stalymi, tylko ze w takim przypadku mowienie o dual-port nie ma sensu... a moze mam zacmienie J.A

pndemon · Answer

no dobra może nie w ISE, bo używam ModelSim'a zrobiłem dokładnie tak: - napisałem kod w vhdlu - syntezator w ISE znał że jest OK - wrzuciłem opis behawioralny do ModelSim'a i było ok (oczywiście nie od razu) - zrobiłem translacje, mapowanie i routing - zacząłem testować model post-place-and-route i nie jest ok Wracając do tablicy to tak: -była sobie tablica do której jedne z procesów zapisywał dane na początku (zawierające strukturę sieci neuronowych), - danych z tej tablicy używały dwa procesy do ładowania do liczników, czyli prościej mówiąc licznik_a

pndemon · Answer

Ponieważ najlepiej uczyć się na błędach innych (w tym przypadku moich) chciałbym opisać co zrobiłem źle: Aby móc przetwarzać dane potrzebuje pewnych informacji na temat struktury sieci neuronowej. Dane te są zapisywane w kilku tablicach o różnych rozmiarach i długości słów (5,4,3,8 bitów). Dane do koprocesora przychodzą poprzez 16-bitowy FSL, stąd nie chcąc wysyłać po jednej dane postanowiłem połączyć je i tak każda z ramek jakie przychodziły zawierała różne dane, np. 8, 5 i 3 bitowe. Łącznie ramek było 12. Problem pojawił się jednak kiedy chciałem wyłuskać poszczególne dane z ramek i przypisać je do odpowiednich tablic, wykorzystałem do tego taki proces (sygnał init_str, to wyjście z licznika): Kod: text Rozwiń Zaznacz wszystko Kopiuj do schowkastr_writing: process(clk, init_str) variable a, b: std_logic_vector(1 downto 0); variable case_sig: std_logic_vector(4 downto 0);begin a := init_str(0)&'1'; b := init_str(0)&'0'; if rising_edge(clk) then if (str_write_en = '1') then if (init_str = 1011) then input_str(3)

J.A · Answer

niestety obawiam sie, ze na bardziej szczegolowe pytania to ci rozsadnie nie odpowiem, bo zarowno vhdl jak i ise sa mi ideologicznie obce do ise nie mam dostepu, a na sledzenie twojego rtl z manualem po prostu nie mam czasu; o ile dobrze rozumiem taki kawalek: if rising_edge(clk) then if (str_write_en = '1') then if (init_str = 1011) then input_str(3) -automat w pewnym stanie (write) chce zapisać coś do pamięci, wystawia więc na szynę > dane oraz ustawia write_en > -przy następnym narastającym zboczu zegarowym następuje zapis > -no automat oczywiście przechodzi w inny stan i sygnały dane i write_en nie są już takie same > -niestety proces zapisu do pamięci już się rozpoczął, i nie zakończył bo w trakcie zabrakło > syg. data i write_en jesli kompilator naprawde uzyl wew. ramu synchronicznego, to opisany efekt nie wystapi, pamiec zapisuje do swoich rejestrow wejsciowych stan linii adresowych, danych i sterujacych zboczem zegara i potrzebny jej hold time to picosekundy; jeszcze raz zastanow sie nad uzyciem wbudowanego w ise coregen [mam nadzieje, ze dobrze pamietam nazwe] do stworzenia pamieci, o ile sie nie myle dostaniesz rowniez przykladowe przebiegi czasowe takiej pamieci w html; JA

pndemon · Answer

coś w tym jest co mówisz , no teraz już wiem że to nie wygląda za dobrze, był to jeden z pierwszych układów jakie napisałem dla tego projektu, i było to jakieś pół roku temu, a ponieważ jest to w zasadzie mój pierwszy poważny projekt, to dopiero się uczę podczas jego tworzenia, teraz jak no to patrzę, to też uważam że nie da się tego zaimplementować , tzn. syntezer jakoś to łykał, ciekawe co z tego powstawało no spoko obawiam się że w tym przypadku korzystam z wbudowanych na matrycę block RAMów, generowanych przez coregen, zresztą podczas symulacji pojawiają się błędu typu hold time validation, a pomysł z przesunięciem fazy nie był dobry, bo jest problem przy odczycie, że dostaje dane zbyt wcześnie

J.A · Answer

jestes pewnien, ze w sens. list procesu powinien byc init_str ? bo to oznacza, ze oczekujesz, ze dane beda sie zmieniac rowniez po zmianie init_str, asynchronicznie do zegarka; po bozemu twoj ram powinien wygladac jakos tak: Kod: text Rozwiń Zaznacz wszystko Kopiuj do schowka   process (clk)     if (piszemy)          ram(licznik_piszacy)

pndemon · Answer

oczywiście proces z pierwszego listingu jest zły, pod tym względem też, nie zauważyłem nawet tego wcześniej.

Dlaczego układ w ISE nie działa mimo poprawnej analizy czasowej?

Post #1

Post #2

Post #3

Post #4

Post #5

Post #6

Post #7

Post #8

Post #9

Post #10

Post #11

Post #12

Post #13

Post #14

Post #15

Post #16

Post #17

Podsumowanie tematu