CATEGORII DOCUMENTE
Afaceri Calculatoare Casa masina Didactica pedagogie Diverse Educatie Finante Geografie Istorie & politica Legislatie Limba Management Sanatate Tehnologie

Bulgara	Ceha slovaca	Croata	Engleza	Estona	Finlandeza	Franceza
Germana	Italiana	Letona	Lituaniana	Maghiara	Olandeza	Poloneza
Sarba	Slovena	Spaniola	Suedeza	Turca	Ucraineana

Administracja	Bajki	Botanika	Budynek	Chemia	Edukacja	Elektronika	Finanse
Fizyczny	Geografia	Gospodarka	Gramatyka	Historia	Komputerów	Książek	Kultura
Literatura	Marketingu	Matematyka	Medycyna	Odżywianie	Polityka	Prawa	Przepisy kulinarne
Psychologia	Różnych	Rozrywka	Sportowych	Technika	Zarządzanie

Sterowniki urz¹dzeń

komputerów

+ Font mai mare | - Font mai mic


DOCUMENTE SIMILARE

Sterowniki urz¹dzeń

W tym rozdziale zapoznamy siź programowaniem j¹dra. Jest to zagadnienie, które z ³atwoci¹ zape³ni³oby samo ca³¹ ksi¹skź, a wiźc nie nalesy tego rozdzia³u uwasaę za kompletny podrźcznik. Chcemy tu tylko pokazaę, w jaki sposób mosna utworzyę sterownik urz¹dzenia (ang. device driver). Wiźkszoę usytkowników nie musi „brudzię” sobie r¹k tymi sprawami, ale jeseli kto ma nietypowy sprzźt, który nie jest obs³ugiwany przez j¹dro Linuksa, mose próbowaę napisaę sam odpowiedni sterownik.

Chcemy zaj¹ę siź tutaj zagadnieniami podstawowymi. W jaki sposób upewnię siź, czy kod inicjuj¹cy jest wywo³ywany w odpowiednim czasie? Jak wykrywaę i konfigurowaę urz¹dzenia na magistrali PCI? Jak do³¹czaę swój sterownik do dzia³aj¹cego systemu? Wskasemy takse na kilka bardziej ulotnych aspektów oprogramowania j¹dra, które s¹ przez usytkowników albo b³źdnie interpretowane, albo trudne do zrozumienia. W szczególnoci omówimy rósne funkcje blokuj¹ce, stosowane w zabezpieczaniu struktur danych i kodu przy równoczesnym dostźpie do nich oraz w sytuacjach, gdy kasdy z tych elementów jest usywany. Pokasemy takse kilka z najczźciej spotykanych sytuacji prowadz¹cych do „wycigu” (czyli b³źdy powodowane przez nienormalny rozk³ad czasowy zdarzeń prowadz¹cy do nieregularnego dzia³ania) i sposoby ich unikania. Omówimy tu równies zasady obowi¹zuj¹ce przy dostźpie do danych zawartych na stronach pamiźci, usywanych przez normalne procesy Linuksa (w tzw. przestrzeni adresowej usytkownika) zamiast w sposób bezpieczny na stronach usytkowanych przez j¹dro (w tzw. przestrzeni adresowej j¹dra), których nie mosna przes³aę na dysk.

Sterownik, który chcemy tu zaprezentowaę jako przyk³ad, bździe sterownikiem urz¹dzenia znakowego, jakim jest inteligentny kontroler magistrali stosowanej w sieci przemys³owej (ang. fieldbus). Bździemy aktualizowaę kod wystźpuj¹cy w j¹drach z rozwojowej serii 2.3. O samym urz¹dzeniu wiemy jedynie to, se jest ono wyposasone w bufor dostźpny z magistrali PCI, przez który zachodzi wymiana danych z bibliotekami rezyduj¹cymi w przestrzeni usytkownika. Co dziwne, karty tego rodzaju s¹ produkowane przez firmź Applicom International S.A. (https://www.applicom-int.com/) i s¹ usywane jako inteligentne urz¹dzenia komunikuj¹ce siź z wiźkszoci¹ spotykanych sieci i magistral przemys³owych.

Kontekst dzia³ania

Kasdy proces dysponuje map¹ pamiźci wirtualnej, odwzorowuj¹c¹ kasd¹ stronź z jego wirtualnej przestrzeni adresowej na strony fizyczne utrzymywane albo w RAM, albo w dyskowym buforze wymiany (ang. swap). Kasdy proces ma takse odwzorowane strony j¹dra, ale mose z nich korzystaę tylko wówczas, gdy procesor nie dzia³a w trybie uprzywilejowanym.

Wiźksza czźę kodu j¹dra dzia³a kontekstowo w odniesieniu do procesu usytkownika, co oznacza, se gdy proces wywo³uje funkcjź systemow¹, to procesor prze³¹cza siź w tryb uprzywilejowany i dalej dzia³a na tej samej mapie pamiźci wirtualnej co proces wywo³uj¹cy. Jeseli tylko kod nie wykona jakiej sztuczki z zarz¹dzaniem pamiźci¹, to procesor ma dostźp tylko do obszaru pamiźci zarezerwowanego dla j¹dra lub obszaru zarezerwowanego dla usytkownika, w imieniu którego dzia³a.

Kasdy kod j¹dra uruchomiony w taki sposób mose korzystaę z pamiźci procesu za pomoc¹ funkcji copy_to_user i copy_from_user, które opiszemy w dalszych czźciach tego rozdzia³u. Kod ten mose takse wywo³ywaę funkcje, które mosna upię (daj¹c procesorowi chwilowe uprawnienia do uruchamiania innych procesów podczas oczekiwania na jakie zdarzenie lub koniec cyklu wyczekiwania).

Niektóre procedury powinny jednak zakończyę siź szybko bez podejmowania prób usypiania. Zalicza siź do nich kod, który mose obs³ugiwaę przerwania (albo wyw³aszczaę) dowolny proces w dowolnym czasie, czyli np. programy obs³ugi przerwań wywo³ywane natychmiast po wyst¹pieniu sygna³u przerwania sprzźtowego i funkcje ustawiane przez liczniki czasu, wywo³ywane przez j¹dro po up³yniźciu okrelonego interwa³u czasowego. Taki kod powinien wiźc dzia³aę w kontekcie procesu, który ma zostaę uruchomiony na tej samej maszynie po spe³nieniu okrelonych warunków i nie powinien powodowaę usypiania tego procesu.

Dowolny kod mose utrzymywaę blokadź, która jest potrzebna przy obs³udze przerwań do poprawnego zakończenia zadania. Kasdy kod, który utrzymuje tak¹ blokadź, powinien równies bez usypiania umosliwiaę jej zwolnienie tak szybko, jak to jest mosliwe.

Normalnie do przydzielania pamiźci w j¹drze Linuksa wykorzystuje siź funkcjź kmalloc, która oprócz s¹danego rozmiaru przydzielanej pamiźci mierzonego w bajtach wymaga podania dodatkowego argumentu. Najczźciej ten dodatkowy argument ma wartoę GFP_KERNEL, co oznacza, se proces wywo³uj¹cy syczy sobie upienia podczas oczekiwania na przydzia³ obszaru pamiźci.

Najlepiej, jeli funkcja kmalloc jest wywo³ywana w kontekcie procesu, dla którego upienie jest dozwolone. Na przyk³ad, sterownik karty sieciowej mose utrzymywaę puste bufory w kolejce, czekaj¹c na odbiór pakietów, aby program obs³uguj¹cy przerwania nie musia³ przydzielaę nowego bufora w odpowiedzi na sygna³ IRQ wygenerowany przez kartź po nadejciu nowego pakietu danych.

Jeseli trzeba przydzielaę pamiźę w kontekcie procesu, dla którego upienie nie jest dozwolone, to usywany jest znacznik GFP_ATOMIC. Oznacza to, se funkcja kmalloc bździe zwracaę sygna³ niepowodzenia, chyba se s¹danie przydzia³u pamiźci zostanie bezzw³ocznie spe³nione.

Modu³ i kod inicjuj¹cy

Prawie w kasdym sterowniku istnieje funkcja inicjuj¹ca, która sprawdza obecnoę obs³ugiwanych urz¹dzeń oraz rejestruje ich dostźpne w³aciwoci funkcjonalne. Trzeba byę pewnym, se funkcja inicjuj¹ca jest wywo³ywana w odpowiednim momencie, czyli podczas rozruchu j¹dra, jeli sterownik jest w nie wbudowany, albo podczas ³adowania do j¹dra modu³u zawieraj¹cego ten sterownik.

W j¹drach Linuksa z serii 2.2 i we wczeniejszych mosna by³o znaleę d³ug¹ listź wywo³ań funkcji inicjuj¹cych pracź rósnych podsystemów i sterowników (lista by³a umieszczona w pliku init/main.c). Po wkompilowaniu jakiego sterownika w j¹dro nalesa³o dodaę do tej listy wywo³anie funkcji inicjuj¹cej ten sterownik. Mog³o to byę albo wywo³anie bezporednie, albo porednie (za pomoc¹ innej funkcji wywo³ywanej z tej listy g³ównej).

Jeseli sterownik by³ skompilowany jako modu³ ³adowany do j¹dra, to nalesa³o wywo³aę procedurź inicjuj¹c¹ init_module. Funkcja obs³uguj¹ca ³adowanie modu³ów do j¹dra pos³ugiwa³a siź t¹ specjaln¹ nazw¹ przy identyfikacji procedury, która mia³a byę wywo³ana przy pierwszym za³adowaniu modu³u.

W j¹drach z serii 2.4 wszystko zosta³o uproszczone i mosna usywaę tego samego kodu zarówno dla sterowników wkompilowanych do j¹dra, jak i dla sterowników w postaci modu³ów. Trzeba tu tylko usywaę jednego prostego polecenia makroprocesora do identyfikacji funkcji, która ma byę wywo³ywana podczas inicjacji, oraz drugiego do identyfikacji funkcji wywo³ywanej przy usuwaniu sterownika z j¹dra (jeli wystźpuje on jako modu³).

Do identyfikacji funkcji inicjuj¹cej stosuje siź wiźc makropolecenie module_init, za do identyfikacji procedury zamykaj¹cej — makropolecenie module_exit. Kasde z nich wymaga podania nazwy wywo³ywanej funkcji jako argumentu. Przyk³ad usycia tych makropoleceń pokazujemy w nastźpnym podrozdziale.

Ani procedura inicjuj¹ca, ani procedura zamykaj¹ca nie wymagaj¹ sadnych argumentów. Procedura inicjuj¹ca zwraca wartoę typu int oznaczaj¹c¹ powodzenie lub niepowodzenie (wartoę niezerowa oznacza nieudan¹ próbź wykrycia lub inicjacji urz¹dzenia). Jeseli sterownik zosta³ skompilowany jako modu³ i procedura inicjuj¹ca init_module zwróci niezerow¹ wartoę, to system automatycznie usunie ten modu³ bez wywo³ywania procedury zamykaj¹cej. W j¹drach z serii 2.4 kod zwracany przez init_module mose byę nastźpnie zwrócony w postaci kodu b³źdu do procesu próbuj¹cego za³adowaę modu³ (zazwyczaj jest to insmod lub modprobe

Funkcja zamykaj¹ca jest wywo³ywana tus przed usuniźciem modu³u z j¹dra, ale tylko wówczas, gdy sterownik zosta³ wczenie za³adowany jako modu³. Podczas wywo³ania funkcji zamykaj¹cej jest jus za póno na zabezpieczenie modu³u przed usuniźciem, nalesy wiźc tylko oczycię pamiźę najlepiej, jak to jest mosliwe. Istniej¹ wprawdzie sposoby zabezpieczania pracuj¹cego modu³u przed usuniźciem, lecz nimi zajmiemy siź w dalszej czźci rozdzia³u.

Sekcje konsolidatora

Jeseli sterownik zosta³ skonsolidowany z j¹drem, to jego procedura inicjuj¹ca bździe wywo³ywana tylko raz podczas rozruchu systemu. W takim wypadku procedura zamykaj¹ca nie bździe wcale wywo³ywana, poniewas j¹dro musi pozostawaę nienaruszone nawet wówczas, gdy ca³a przestrzeń usytkownika zosta³a zamkniźta, czyli as do usuniźcia modu³ów. Pozostawianie w pamiźci ca³ego kodu i danych wymaganych przez procedury inicjuj¹ce i zamykaj¹ce mosna traktowaę jako dus¹ rozrzutnoę. J¹dro Linuksa nie mose byę przechowywane na dysku, a wiźc taki nieusywany kod zajmuje cenn¹ pamiźę RAM.

Aby temu zapobiec, programista mose podczas budowy j¹dra zaznaczyę niektóre dane i funkcje, które mosna usun¹ę, jeli nie bźd¹ jus potrzebne.

Najczźciej do tego celu bywa usywane makropolecenie __init, które s³usy do oznaczania funkcji inicjuj¹cych. Istnieje takse makropolecenie __exit dotycz¹ce funkcji usuwaj¹cych modu³y oraz polecenia __initdata i __exitdata dotycz¹ce danych, które mog¹ byę usuniźte. Dzia³aj¹ one na zasadzie umieszczania obs³ugiwanych przez nie elementów w innej sekcji ELF nis normalny kod i dane. W nastźpnym podrozdziale pokazany jest przyk³ad zastosowania tych makropoleceń.

Wnikliwy obserwator komunikatów wytwarzanych przez j¹dro podczas rozruchu systemu (dostźpnych takse za pomoc¹ polecenia dmesg) zauwasy, se natychmiast po zamontowaniu g³ównego systemu plików pojawia siź komunikat podobny do pokazanego nisej:

Freeing unused kernel memory: 108k freed

Oznacza to, se zwolniono 108 kB pamiźci j¹dra zawieraj¹cej dane, o których wiadomo, se nie bźd¹ jus potrzebne. Takie fragmenty pamiźci zwalniane podczas dzia³ania systemu stanowi¹ w³anie zawartoę sekcji __init i __initdata. Jeseli wiadomo jus podczas kompilacji, se nawet fragmenty oznaczone jako __exit i __exitdata bźd¹ usywane tylko przez modu³y, to s¹ one po prostu pomijane podczas końcowego przebiegu konsolidatora przy tworzeniu ostatecznej, daj¹cej siź uruchomię kopii j¹dra.

Przyk³adowy kod modu³u

Ponisej podano szkieletow¹ postaę sterownika, który po inicjacji wypisuje stosowny komunikat i kończy dzia³anie. Wykorzystano w nim równies w odpowiedni sposób makropolecenia __init __exit __initdata oraz __exitdata. Sterownik wspó³pracuje z j¹drami od serii 2.4 i nowszymi. Przy za³oseniu, se pliki ród³owe j¹dra znajduj¹ siź na swoim zwyk³ym miejscu (/usr/src/linux) i se podany nisej kod jest zawarty w pliku o nazwie example.c, mosna go skompilowaę w nastźpuj¹cy sposób:

$ gcc -DMODULE -D__KERNEL__ -I/usr/src/linux/include -c example.c

Wszystkie kody wchodz¹ce w sk³ad j¹dra kompiluje siź przy w³¹czonej definicji __KERNEL__, dziźki czemu pliki do³¹czane wspó³dzielone przez j¹dro i bibliotekź C (libc) mog¹ zawieraę czźci wykorzystywane wy³¹cznie przez j¹dro. £adowalne modu³y maj¹ takse w³¹czon¹ definicjź MODULES. Wiźcej szczegó³ów na temat do³¹czania sterowników do plików Makefile i konfiguracji systemu mosna znaleę pod koniec tego rozdzia³u.

#include <linux/kernel.h>

#include <linux/module.h>

#include <linux/init.h>

static char __initdata hellomessage[] = KERN_NOTICE 'Hello, world!n';

static char __exitdata byemessage[] = KERN_NOTICE 'Goodbye, cruel world.n';

static int __init start_hello_world(void)

static void __exit go_away(void)

module_init(start_hello_world);

module_exit(go_away);

Po kompilacji powinien powstaę plik example.o, który bździe mosna za³adowaę do j¹dra za pomoc¹ polecenia insmod, a nastźpnie usun¹ę go za pomoc¹ polecenia rmmod

$ /sbin/insmod example.o

$ /sbin/rmmod example

Jeseli usyje siź tych poleceń z wirtualnej konsoli, to bździe mosna zaobserwowaę komunikaty wysy³ane przy zadzia³aniu kasdej funkcji inicjuj¹cej i zamykaj¹cej. Przy korzystaniu ze zdalnego terminala lub z X Window do obejrzenia tych komunikatów nalesy usyę polecenia dmesg

Urz¹dzenia i sterowniki magistrali PCI

Po omówieniu sposobu w³¹czania kodu do j¹dra pokasemy teraz sposób, w jaki j¹dro Linuksa obs³uguje urz¹dzenia na magistrali PCI.

Struktura pci_dev

Struktura pci_dev jest g³ównym miejscem do przechowywania informacji o fizycznym urz¹dzeniu PCI wykorzystywanym przez system Linux. Jej pe³n¹ postaę mosna obejrzeę w pliku /include/linux/pci.h (po³osenie pliku zalesy od konfiguracji) i zawiera ona o wiele wiźcej elementów, nis bździemy tu omawiaę. Istnieje w niej kilka pól, które bezporednio dotycz¹ omawianego zagadnienia. Najpierw zajmiemy siź polami pomagaj¹cymi rozpoznaę dane urz¹dzenie.

Pola liczbowe stanowi¹ odwzorowanie podstawowej czźci specyfikacji PCI, za tabela zawieraj¹ca przyporz¹dkowane sobie identyfikatory, nazwy producentów oraz urz¹dzeń znajduje siź w pliku linux/drivers/pci/pci.ids (przy j¹drach z serii 2.4) albo w pakiecie pciutils

unsigned short vendor ID producenta PCI

unsigned short device ID urz¹dzenia PCI

unsigned short subsystem_vendor ID producenta podsystemu PCI

unsigned short subsystem_device ID podsystemu urz¹dzenia PCI

unsigned int class Kombinacja of klasy podstawowej,

podklasy i interfejsu programowego

Nastźpnie umieszczone s¹ pola umosliwiaj¹ce wyszukanie zasobów pamiźci, adresów weję i wyję oraz przerwań usywanych przez urz¹dzenie PCI. Zasoby te s¹ w zasadzie przydzielane w komputerze PC w konfiguracji BIOS, ale mosna je inaczej odwzorowaę w j¹drze albo nawet przydzielię je od nowa. Gdy Linux przydziela zasoby, mose nie zmieniaę wartoci w pamiźci konfiguracyjnej urz¹dzeń PCI, a wiźc wasne jest, aby programista nie odczytywa³ ich z tych urz¹dzeń, lecz korzysta³ z wartoci przechowywanych w strukturze pci_dev powi¹zanej z danym urz¹dzeniem:

unsigned int irq Linia przerwań (IRQ)

struct resources resource[] porty I/O i obszary pamiźci

Adresy weję i wyję (porty I/O) oraz adresy pamiźci wykorzystywane przez urz¹dzenie s¹ opisane w strukturze zdefiniowanej w pliku include/linux/ioport.h. Czźę tej struktury mose byę na tym etapie istotna dla programisty:

unsigned long start, end

unsigned long flags

Pola start i end okrelaj¹ zakres adresów pamiźci zajmowanej przez urz¹dzenie, za pole flags zawiera znaczniki zdefiniowane takse w inlude/linux/ioport.h. W tym przypadku kasdy zasób powinien mieę ustawiony albo bit IORESOURCE_IO (dla portów I/O), albo bit IORESOURCE_MEM (dla obszarów pamiźci wykorzystywanych do komunikacji z urz¹dzeniem, tzw. MMIO). Zalesy to od rodzaju dostźpu do urz¹dzenia. W celu zachowania zgodnoci z przysz³ymi modyfikacjami struktury, przy dostźpie do tej informacji najlepiej skorzystaę z makropoleceń pci_resource_start pci_resource_end i pci_resource_flags. Polecenia te wymagaj¹ podania dwóch argumentów: struktury urz¹dzenia PCI i numeru zasobu w postaci przesuniźcia wzglźdem pocz¹tku podanej wysej tablicy zasobów. Obecnie makropolecenia te s¹ zdefiniowane w pliku include/linux/pci.h w nastźpuj¹cy sposób:

#define pci_resource_start(dev,bar) ((dev)->resource[(bar)].start)

#define pci_resource_end(dev,bar) ((dev)->resource[(bar)].end)

#define pci_resource_flags(dev,bar) ((dev)->resource[(bar)].flags)

Istnieje takse makropolecenie o nazwie pci_resource_len obliczaj¹ce rozmiary obszaru zajmowanego od adresu pocz¹tkowego do adresu końcowego.

Na zakończenie tych informacji nalesy jeszcze wspomnieę o polu identyfikuj¹cym sterownik PCI aktualnie kontroluj¹cy urz¹dzenie (jeseli takie istnieje) oraz o obszarze pamiźci zarezerwowanym na prywatne dane wymagane np. do ledzenia stanu urz¹dzenia:

struct pci_driver *driver Struktura sterownika PCI (opisana dalej)

void *driver_data Prywatne dane dla sterownika PCI

Wyszukiwanie urz¹dzeń PCI

Istnieje kilka sposobów wykrywania urz¹dzeń PCI przez sterownik dzia³aj¹cy w systemie umosliwiaj¹cym sterowanie. Mosna przeprowadzię rźczne przeszukiwanie dostźpnych magistrali w czasie inicjacji, uruchamiaj¹c natychmiast wykryte urz¹dzenia. Mosna takse zarejestrowaę siź w podsystemie PCI j¹dra, podaj¹c strukturź zawieraj¹c¹ wywo³ania zwrotne i zestaw kryteriów dla urz¹dzeń, którymi jestemy zainteresowani, a nastźpnie czekaę bezczynnie as do wezwania funkcji wywo³ań zwrotnych (wystźpuj¹cego wówczas, gdy urz¹dzenie spe³niaj¹ce podane kryteria zostanie do³¹czone do systemu lub z niego usuniźte).

Pierwsza metoda, czyli przeszukiwanie rźczne (ang. manual scanning) jest stosowana w j¹drach Linuksa z serii 2.2 i wczeniejszych. Nie umosliwia ona obs³ugi kart PCI wymienianych podczas pracy systemu (np. CompactPCI, CardBus itp.). W j¹drach z serii 2.4 mosna tź metodź zastosowaę, lecz traktowana jest jako przestarza³a w porównaniu do systemu wywo³ań zwrotnych dla PCI.

Przeszukiwanie rźczne

Pomimo se przeszukiwanie rźczne jest nazywane przestarza³ym w j¹drach z serii 2.4, warto wyjanię w skrócie na czym ono polega, poniewas nadal jest ono potrzebne w kodzie, który ma dzia³aę na j¹drach z serii 2.2.

W najprostszej postaci przeszukiwania wykorzystuje siź funkcjź pci_find_device, która wymaga podania trzech argumentów: identyfikatora producenta, identyfikatora urz¹dzenia i wskanika do struktury pci_dev * okrelaj¹cego miejsce na licie urz¹dzeń PCI, od którego nalesy rozpocz¹ę przeszukiwanie. Taka postaę trzeciego argumentu jest potrzebna po to, aby mosna by³o znaleę kilka urz¹dzeń spe³niaj¹cych kryteria, a nie tylko jedno.

Aby rozpocz¹ę przeszukiwanie od pocz¹tku listy, nalesy podaę NULL jako wartoę trzeciego argumentu. Kontynuacja przeszukiwania, pocz¹wszy od ostatnio znalezionego urz¹dzenia, odbywa siź po podaniu adresu tego w³anie urz¹dzenia. Dozwolone jest tu usycie sta³ej PCI_ANY_ID jako identyfikatora wieloznacznego, czyli np. szukaj¹c dowolnego urz¹dzenia wytwarzanego przez producenta o identyfikatorze PCI_VENDOR_ID_MYVENDOR podanym w pliku include/linux/pci_ids.h mosna usyę nastźpuj¹cego kodu:

struct pci_dev *dev = NULL;

while ((dev=pci_find_device(PCI_VENDOR_ID_MYVENDOR,

PCI_ANY_ID, dev)))

setup_device(dev);

Istnieje takse kilka innych funkcji, dziźki którym sterownik mose wyszukiwaę urz¹dzenia spe³niaj¹ce inne kryteria, np. pci_find_class pci_find_subsys lub pci_find_slot. Wszystkie te funkcje s¹ zdefiniowane w pliku include/linux/pci.h

struct pci_dev *pci_find_device (unsigned int vendor, unsigned int device,

const struct pci_dev *from);

struct pci_dev *pci_find_subsys (unsigned int vendor, unsigned int device,

unsigned int ss_vendor, unsigned int ss_device,

const struct pci_dev *from);

struct pci_dev *pci_find_class (unsigned int class, const struct pci_dev *from);

struct pci_dev *pci_find_slot (unsigned int bus, unsigned int devfn);

Sterowniki PCI

Niezalesnie od tego, se opisana wysej metoda wyszukiwania urz¹dzeń dzia³a takse w j¹drach z serii 2.4, to zalecan¹ dla tych j¹der metod¹ tworzenia sterownika PCI jest rejestracja w podsystemie PCI obecnoci procedury wykrywaj¹cej i kilku danych o wykrywanych urz¹dzeniach. Podsystem PCI jest specyficznym rozwi¹zaniem zastosowanym w j¹drach z serii 2.4 i nie ma go w j¹drach z serii 2.2. Wszystkie istotne informacje o sterowniku s¹ przechowywane w strukturze pci_driver, która powinna zostaę wype³niona przez funkcjź inicjuj¹c¹, a nastźpnie zarejestrowana za pomoc¹ funkcji register_pci_driver. Ta struktura i funkcje s¹ zdefiniowane w pliku include/linux/pci.h

int pci_register_driver(struct pci_driver *)

void pci_unregister_driver(struct pci_driver *);

Pola w strukturze pci_driver, które musz¹ byę wype³nione danymi, s¹ nastźpuj¹ce:

char *name	Nazwa sterownika urz¹dzenia.
const struct pci_device_id *id_table	Lista identyfikatorów obs³ugiwanych urz¹dzeń.
int (probe) (struct pci_dev dev, const struct pci_device_id *id)	Funkcja sonduj¹ca, wywo³ywana przez podsystem PCI j¹dra wtedy, gdy zosta³o znalezione urz¹dzenie pasuj¹ce do jednego z wpisów w id_table
void (*remove)	Wywo³ywane przez podsystem PCI j¹dra wtedy, gdy urz¹dzenie zostanie usuniźte, lub po wyrejestrowaniu pci_driver
void (suspend) (struct pci_dev dev)	Wywo³ywane przez kod obs³uguj¹cy oszczźdzanie energii w celu poinformowania sterownika, se urz¹dzenie zosta³o zatrzymane.
void (resume) (struct pci_dev dev)	Wywo³ywane przez kod obs³uguj¹cy oszczźdzanie energii w celu powiadomienia sterownika, se urz¹dzenie zosta³o obudzone i mose wymagaę ponownej inicjacji.

Struktura pci_device_id zdefiniowana takse w pliku include/linux/pci.h zawiera informacje podobne do tych, które by³y przekazywane funkcjom pci_find_ S¹ to:

unsigned int vendor, device	Wymagane identyfikatory producenta i urz¹dzenia albo PCI_ANY_ID gdy identyfikacja nie jest wasna.
unsigned int subvendor, subdevice	Wymagane numery identyfikacyjne podsystemu lub PCI_ANY_ID
unsigned int class, class_mask	Kombinacja po jednym bajcie dla kasdego elementu (klasy, podklasy, interfejsu programowego) z mask¹ bitow¹. Bit maski o wartoci 1 oznacza poszukiwanie odpowiadaj¹cego mu bitu w bajcie elementu. Bity w polu class, dla których odpowiadaj¹cy im bit w polu class_mask nie jest ustawiony, nie musz¹ byę dopasowane.
unsigned long driver_data	Dane prywatne wykorzystywane przez sterownik.

Po tym, jak pasuj¹cy identyfikator pci_device_id zostanie przekazany do funkcji sonduj¹cej sterownika, pole driver_data mose byę usyte do przechowywania specyficznych informacji o urz¹dzeniu (informacje te mog¹ byę rósne dla rósnych urz¹dzeń obs³ugiwanych przez dany sterownik). Przyk³adowo: sterownik obs³uguj¹cy rósne wersje kart lub zestawów uk³adów scalonych mose w polu device_data dla kasdej dopasowanej struktury pci_device_id umieszczaę zestaw znaczników charakteryzuj¹cych w³aciwoci urz¹dzenia. W takim przypadku funkcja sonduj¹ca sterownika nie musi ponownie sprawdzaę dok³adnych numerów urz¹dzeń.

Pole id_table struktury pci_driver powinno wskazywaę na tablicź zawieraj¹c¹ dopasowane struktury pci_device_id, zakończon¹ wpisem wype³nionym zerowymi wartociami.

Podczas pierwszej rejestracji sterownika jego funkcja sonduj¹ca jest wywo³ywana dla kasdego urz¹dzenia PCI w systemie, które pasuje do wpisu na licie pci_device_id i które nie zosta³o jeszcze przydzielone innemu sterownikowi. Jeseli póniej bźd¹ dodawane nowe pasuj¹ce urz¹dzenia, które mog¹ byę w³¹czane podczas pracy systemu, to podsystem PCI j¹dra bździe wywo³ywa³ funkcje sonduj¹ce kasdego zarejestrowanego sterownika pasuj¹cego do nowego urz¹dzenia as do momentu, gdy która z nich zwróci wartoę zerow¹ (co oznacza, se dany sterownik zaakceptowa³ urz¹dzenie).

Mamy tu gwarancjź, se funkcja sonduj¹ca naszego sterownika bździe wywo³ywana w kontekcie procesu (patrz wczeniejszy podrozdzia³ na temat uruchamiania kontekstowego). Oznacza to, se ta funkcja mose byę w razie potrzeby upiona. Funkcja powinna zwracaę wartoę zerow¹, jeseli urz¹dzenie zostanie zaakceptowane i sterownik mose je obs³usyę, w przeciwnym wypadku powinien zostaę zwrócony niezerowy kod b³źdu. Pozwala to podsystemowi PCI przeję do innych sterowników, do których pasuje identyfikator wystźpuj¹cy na licie. Kody b³źdów s¹ zdefiniowane w plikach include/linux/errno.h oraz include/asm/errno.h — i tak jak dla wszystkich funkcji wystźpuj¹cych w j¹drze Linuksa — normalne jest zwracanie ujemnych wartoci sygnalizuj¹cych b³¹d, na przyk³ad:

return -EIO; /* I/O error encountered */

Funkcja usuwaj¹ca sterownika bździe wywo³ywana tylko dla tych urz¹dzeń, które zosta³y zaakceptowane przez funkcjź sonduj¹c¹. Bździe ona wywo³ywana automatycznie przez podsystem PCI j¹dra podczas usuwania urz¹dzeń, które mog¹ byę wymieniane w czasie pracy systemu, albo przy wyrejestrowaniu sterownika za pomoc¹ procedury pci_unregister_driver. W tym wypadku funkcja usuwaj¹ca bździe wywo³ywana tyle razy, ile urz¹dzeń by³o obs³ugiwanych przez sterownik.

Czasami w j¹drze nie jest uaktywniony system oszczźdzania energii i wtedy funkcje suspend i resume nie bźd¹ nigdy wywo³ywane. Odpowiednie pola w strukturze s¹ jednak obecne przez ca³y czas, ale ich wartoci bźd¹ równe NULL. Oznacza to, se tego rodzaju w³aciwoci nie bźd¹ obs³ugiwane.

Funkcje dostźpu do urz¹dzeń PCI

Przed prób¹ dostania siź do portów I/O lub dzielonej pamiźci urz¹dzenia sterownik powinien sprawdzię, czy urz¹dzenie jest aktywne. S³usy do tego funkcja pci_enable_device, która próbuje przydzielię porty I/O oraz wymagane obszary pamiźci, a takse sprawdza, czy urz¹dzenie jest poprawnie zasilane. Nalesy byę przygotowanym na obs³ugź takiej sytuacji, se wywo³anie pci_enable_device nie powiedzie siź i trzeba bździe wywietlię komunikat ostrzegawczy oraz zwrócię niezerowy wynik z procedury inicjuj¹cej. Funkcja ta zwraca niezerow¹ wartoę sygnalizuj¹c¹ wyst¹pienie b³źdu lub zero po pomylnym zakończeniu:

int pci_enable_device(struct pci_dev *dev);

Oprócz tego, jeli bźd¹ potrzebne funkcje zarz¹dzania magistral¹, to nalesy je oddzielnie uaktywnię za pomoc¹ funkcji pci_set_master. Wywo³anie tej funkcji zawsze musi siź udaę:

void pci_set_master(struct pci_dev *dev);

Po uaktywnieniu urz¹dzenia mosna korzystaę z obszaru pamiźci konfiguracyjnej PCI pos³uguj¹c siź funkcj¹ pci_read_config_byte i zwi¹zanymi z ni¹ procedurami. Dozwolone s¹ tu wszelkie kombinacje odczytu i zapisu bajtów, s³ów i s³ów podwójnych. Nalesy przy tym pamiźtaę, se wszystkie procedury pci_read_config_* nie zwracaj¹ odczytanej wartoci, lecz wskanik do miejsca ich przechowywania, oraz se mog¹ zwracaę kod b³źdu (albo zero w wypadku udanej operacji):

int pci_read_config_byte(struct pci_dev *dev, int where, u8 *val);

int pci_read_config_word(struct pci_dev *dev, int where, u16 *val);

int pci_read_config_dword(struct pci_dev *dev, int where, u32 *val);

int pci_write_config_byte(struct pci_dev *dev, int where, u8 *val);

int pci_write_config_word(struct pci_dev *dev, int where, u16 *val);

int pci_write_config_dword(struct pci_dev *dev, int where, u32 *val);

Przydzia³ zasobów

Zanim bździe mosna skorzystaę z portów I/O lub pamiźci, musz¹ one zostaę poprawnie przydzielone. W przypadku obszarów pamiźci rezerwowanych dla urz¹dzenia PCI ich fizyczne adresy musz¹ byę odwzorowane w wirtualnej przestrzeni adresowej procesora — w taki sam sposób, jak wszystkie inne strony fizyczne pamiźci s¹ odwzorowywane w adresach wirtualnych.

Do przydzia³u portów I/O lub obszaru pamiźci usywa siź odpowiednio funkcji request_region lub request_memory_region. Kasda z nich wymaga podania adresu pocz¹tkowego, rozmiaru rezerwowanego obszaru oraz nazwy, która bździe usywana przy wywietlaniu mapy przydzia³u zasobów w pliku /proc/ioports lub /proc/iomem (przy za³oseniu, se w systemie zosta³ zamontowany specjalny system plików /proc

Funkcje te mog¹ zwracaę wartoci NULL w wypadku nieudanej próby przydzia³u zasobów lub wskaniki do struktury przydzielonego obszaru, jeseli wszystko przebiegnie pomylnie. W rzeczywistoci w j¹drach z serii 2.4 funkcje te s¹ makropoleceniami korzystaj¹cymi z tej samej rodzimej funkcji __request_region, ale nie jest to widoczne dla kodu usywaj¹cego tych makropoleceń. Wywo³ania te maj¹ nastźpuj¹c¹ postaę:

struct resource *request_region(unsigned long start,

unsigned long n, const char * name);

struct resource *request_mem_region(unsigned long start,

unsigned long n, const char * name);

Nie ma potrzeby przechowywania zwróconych adresów nowego zasobu, poniewas przydzielony obszar mose byę zwolniony za pomoc¹ funkcji release_region lub release_mem_region. Funkcje te wymagaj¹ podania takich samych argumentów, jak odpowiadaj¹ce im funkcje do przydzia³u zasobów. Obydwie funkcje s¹ zdefiniowane w pliku include/ioport.h i podobnie jak poprzednie, równies s¹ makropoleceniami korzystaj¹cymi z pewnych rodzimych procedur obs³ugi zasobów. Ich wywo³ania maj¹ nastźpuj¹c¹ postaę:

void release_region(unsigned long start, unsigned long n);

void release_mem_region(unsigned long start, unsigned long n);

Po przydzieleniu zasobów mosna natychmiast korzystaę z portów I/O, lecz dostźp do obszarów pamiźci bździe mosliwy dopiero po ich odwzorowaniu w wirtualnej przestrzeni adresowej j¹dra. Do tego odwzorowania s³usy funkcja ioremap, przekazuj¹ca fizyczny adres znaleziony w strukturze zasobów danego urz¹dzenia oraz rozmiar obszaru, który ma byę odwzorowany. Zazwyczaj wartoci tych argumentów pokrywaj¹ siź z wartociami start i length usywanymi przez wczeniej opisywane makropolecenia pci_resource_start i pci_resource_length

Odwzorowanie skonfigurowane za pomoc¹ ioremap mosna póniej usun¹ę, przekazuj¹c zwrócony przez tź funkcjź adres do funkcji iounmap wykonuj¹cej operacjź odwrotn¹:

void *ioremap(unsigned long offset, unsigned long size);

void iounmap(void * addr);

Funkcja ioremap zwraca adres nales¹cy do wirtualnej przestrzeni adresowej procesora. Tego adresu nie mosna usyę bezporednio jako wskanika, ale tylko poprzez makropolecenia readb readw readl writeb writew i writel. Pomimo tego, se bezporedni dostźp do odwzorowanego obszaru jest obecnie mosliwy w 32-bitowych maszynach z procesorami firmy Intel, to kod korzystaj¹cy z tej w³aciwoci nie bździe przenony, czyli nalesy go traktowaę jako b³źdny. Procesory Alpha 21064 nie umosliwiaj¹ np. adresowania pojedynczych bajtów i musz¹ korzystaę z rósnych wirtualnych adresów przy dostźpie do magistral o rósnej szerokoci, pozostawiaj¹c ca³¹ obs³ugź tego problemu uk³adom PCI. W takim przypadku usycie wysej wymienionych makropoleceń jest bezwzglźdn¹ koniecznoci¹.

Obs³uga przerwań

Oprócz konfiguracji portów I/O oraz adresów pamiźci urz¹dzenia trzeba takse zadbaę o odpowiedni¹ obs³ugź przerwań. Zajmuje siź tym fragment kodu wywo³ywany za kasdym razem, gdy urz¹dzenie wykryje obecnoę sygna³u na linii IRQ w magistrali PCI.

Na temat programów do obs³ugi przerwań wspomniano na pocz¹tku rozdzia³u. Wiadomo, se przerwanie mose wyst¹pię w dowolnym momencie i se program obs³uguj¹cy je musi dzia³aę bardzo szybko, bez usypiania oraz bez prób dostźpu obszarów pamiźci zarezerwowanych dla usytkownika.

Funkcja obs³uguj¹ca przerwanie (ang. interrupt handler) ma nastźpuj¹cy prototyp:

void my_irqhandler(int irq, void *dev_id, struct pt_regs *regs);

Argument irq jest numerem linii IRQ, na której wyst¹pi³ sygna³ przerwania. Program mose skorzystaę z tej wartoci, jeseli zosta³ zarejestrowany do obs³ugi wiźcej nis jednego poziomu przerwań (czyli gdy np. urz¹dzenie wykorzystuje wiźcej nis jedn¹ liniź przerwań) lub gdy ten sam program zosta³ wielokrotnie zarejestrowany do obs³ugi rósnych urz¹dzeń. Drugim argumentem jest nieprzezroczysty wskanik (ang. opaque pointer) *dev_id (j¹dro nigdy siź do niego nie odwo³uje) przekazywany przez sterownik podczas rejestracji programu obs³ugi przerwania. Ostatni argument (*regs) jest wskanikiem do obszaru pamiźci, w którym podczas obs³ugi przerwania s¹ przechowywane zawartoci rejestrów procesora. Normalnie nie jest potrzebny dostźp do tych wartoci, ale gdy np. w procesorach Intel 386 operacja zmiennoprzecinkowa jest sygnalizowana za pomoc¹ przerwania, to program obs³uguj¹cy takie przerwanie musi mieę mosliwoę odczytu i modyfikacji zawartoci rejestrów jeszcze przed zakończeniem obs³ugi.

Aby zarejestrowaę program obs³ugi przerwań, nalesy usyę funkcji request_irq zdefiniowanej w pliku include/linux/sched.h

int request_irq(unsigned int irq,

void (*handler)(int, void *, struct pt_regs *),

unsigned long irqflags, const char *devname,

void *dev_id);

Mamy tu kilka argumentów. Pierwszym z nich jest numer s¹danej linii przerwań (irq), a drugim jest wskanik do faktycznego programu obs³ugi (handler), który ma byę wzywany przy kasdym sprzźtowym wyzwoleniu przerwania. Argument devname jest usywany przy wpisywaniu przydzielonych przerwań do specjalnego pliku /proc/interrupts, za dev_id jest nieprzezroczystym wskanikiem (by³ omawiany wczeniej) przekazywanym do programu obs³ugi przy kasdym wezwaniu. Argument irqflags mose zawieraę dowolne znaczniki zdefiniowane w pliku include/asm/signal.h. Wiele z nich to znaczniki przestarza³e lub nieobs³ugiwane, za najwasniejsze z nich s¹ objanione nisej:

SA_SHIRQ	Akceptacja wspó³dzielonych przerwań. Do momentu ustawienia tego znacznika na wszystkich programach obs³ugi tylko jeden z nich mose byę zarejestrowany dla danego poziomu IRQ. W poprawnie zaprojektowanych urz¹dzeniach PCI nigdy nie powinno byę konieczne rejestrowanie obs³ugi przerwania bez w³¹czonego znacznika SA_SHIRQ
SA_INTERRUPT	Znacznik ten umosliwia zablokowanie systemu przerwań procesora po wezwaniu programu obs³ugi przerwań. Nie powinien on byę ustawiany przez sterowniki normalnych urz¹dzeń.
SA_SAMPLE_RANDOM	W³¹czenie tego znacznika powoduje wykorzystanie kroku czasowego danego przerwania przy generacji danych dla urz¹dzenia /dev/random

Na zakończenie program obs³ugi jest wyrejestrowywany za pomoc¹ funkcji free_irq, do której powinny zostaę przekazane takie same argumenty, jakie przekazano wczeniej do funkcji request_irq

void free_irq(unsigned int irq, void *dev_id);

Zwróęmy uwagź na to, se pomimo is j¹dro nigdy nie odwo³uje siź do wskanika dev_pci, to korzysta z niego przy okrelaniu programu obs³ugi, który ma byę zwolniony w przypadku, gdy do obs³ugi tego samego przerwania zarejestrowano wiźcej programów. Z tego w³anie powodu sterownik nie powinien nadawaę temu wskanikowi wartoci NULL nawet gdy nie bździe z niego korzysta³. Nalesy wówczas wstawię tam jak¹ wartoę specyficzn¹ dla danego sterownika.

Kod sterownika PCI modu³u Applicom

Nadszed³ teraz czas na sprawdzenie swoich umiejźtnoci, bowiem w tym podrozdziale pokasemy rzeczywisty kod. Opiszemy tu rejestracje struktury pci_driver sterownika zawieraj¹cego prosty kod próbkuj¹cy kartź przemys³ow¹ firmy Applicom (wspomnian¹ na pocz¹tku rozdzia³u).

Rozpoczniemy od deklaracji funkcji:

static int apdrv_probe(struct pci_dev *dev,
const struct pci_device_id *devid)

Jeseli wydaje siź, se wszystko dzia³a poprawnie, musimy zarejestrowaę program obs³uguj¹cy przerwania dla numeru znalezionego w strukturze pci_dev naszego urz¹dzenia. Zastosujemy tu znacznik SA_SHIRQ dla podkrelenia, se korzystamy z dzielonych przerwań. Jeli rejestracja siź nie uda, to tak jak poprzednio sygnalizujemy b³¹d, wywo³ujemy iounmap i przerywamy dzia³anie:

if (request_irq(dev->irq, &ac_interrupt, SA_SHIRQ,

'Applicom PCI', dev))

Jeseli do tego momentu nie zosta³ zwrócony saden kod b³źdu, to wszystko dzia³a poprawnie i mosna zwrócię kod sygnalizuj¹cy taki stan. Oznacza to, se kontrolujemy urz¹dzenie i se nie powinno byę ono udostźpniane innym sterownikom, nawet jeseli bździe mog³o byę przez nie obs³ugiwane:

return 0;

Dostźp do pamiźci w obszarze usytkownika

Po wykryciu urz¹dzenia i stwierdzeniu, se mosna siź z nim komunikowaę, trzeba znaleę sposób wymiany pakietów danych miedzy tym urz¹dzeniem i korzystaj¹cymi z niego programami dzia³aj¹cymi w przestrzeni adresowej usytkownika.

Jak jus wspomniano wczeniej, obszar danych obs³ugiwany przez usytkownika wymaga specjalnego traktowania podczas dostźpu z j¹dra. Jeseli usytkownik zapewnia bufor danych, mog¹ tu siź pojawię trzy problemy:

q Po pierwsze: Usytkownik mose przekazaę niepoprawny wskanik, który mose zmylię nasz kod, kieruj¹c jego dane do obszaru j¹dra lub pamiźci usytkownika, do których dostźp jest zabroniony. Mose to równies powodowaę, se kod bździe odczytywa³ dane z obszaru, z którego odczyt nie jest dozwolony.

q Po drugie: Poniewas struktury danych j¹dra nigdy nie s¹ zapisywane na dysk, a bufor usytkownika mose w rzeczywistoci nie byę umieszczony w fizycznej pamiźci RAM, to kasda próba dostźpu do takiego bufora bździe siź kończyę b³źdem stronicowania. Nasz kod musi wówczas czekaę na ponowne pobranie strony pamiźci z obszaru wymiany.

q Po trzecie: Nalesy byę wiadomym tego, se rósne procesy nie korzystaj¹ z tej samej przestrzeni adresowej. Wskaniki z przestrzeni usytkownika musz¹ byę obowi¹zkowo usywane w kontekcie tego samego procesu, jak proces przekazuj¹cy wskanik do bufora.

Fakt, se dostźp do wskaników w przestrzeni adresowej usytkownika mose powodowaę b³źdy stronicowania, oznacza, se nie mosna korzystaę z tej przestrzeni w sytuacjach, gdy nasz kod nigdy nie mose byę upiony, czyli gdy procesor wykonuj¹cy ten kod ma zablokowane przerwania albo gdy np. kod podtrzymuje blokadź pźtlow¹ (ten rodzaj blokady i inne omówione s¹ dalej).

Program obs³uguj¹cy przerwania równies nie mose skorzystaę z obszaru pamiźci usytkownika — nie tylko z tego powodu, se mog³oby to prowadzię do jego upienia w oczekiwaniu na pobranie strony pamiźci z obszaru wymiany, ale przede wszystkim dlatego, se nie ma mosliwoci okrelenia procesu, w kontekcie którego program mia³by dzia³aę.

Aby umosliwię ominiźcie tych wszystkich pu³apek, w Linuksie zdefiniowano makropolecenia copy_to_user i copy_from_user zapewniaj¹ce dostźp do danych w obszarze usytkownika. Te makropolecenia sprawdzaj¹ odpowiednie uprawnienia do dostźpu oraz zachowuj¹ siź poprawnie takse przy b³ździe stronicowania, jeseli pojawi siź on z jakichkolwiek powodów.

S¹ dwie g³ówne przyczyny b³źdów stronicowania pamiźci (ang. page fault). Oczekuje siź, se najczźciej wystźpuje sytuacja, gdy strona istnieje, ale nie jest poprawnie odwzorowana w pamiźci fizycznej. Mose siź to zdarzyę wówczas, gdy strona danych zosta³a przeniesiona do obszaru wymiany w celu zwolnienia miejsca w fizycznej pamiźci RAM albo gdy strony rezyduj¹ w pliku wykonywalnym w systemie plików i musz¹ byę ³adowane na s¹danie (Linux nie ³aduje programów bezporednio do pamiźci podczas ich uruchamiania, lecz czeka przed ich za³adowaniem na udostźpnienie kasdej strony).

W takich okolicznociach program obs³uguj¹cy b³źdy stronicowania jest upiony, oczekuj¹c na pojawienie siź s¹danej strony w pamiźci. Dopiero wtedy podejmie on dzia³anie na kopii — tak, jakby nic siź nie sta³o.

Inna klasa b³źdów stronicowania pojawia siź wówczas, gdy s¹danie dostźpu nie jest poprawne. Mose tak siź zdarzyę np. z powodu b³źdnego odwo³ania do wskanika lub dokonania próby zapisu w obszarze dostźpnym tylko do odczytu. Jeseli wyst¹pi b³¹d stronicowania takiego rodzaju, makropolecenie zwróci niezerowy wynik sygnalizuj¹cy ten fakt.

Jak wspomniano poprzednio, ze wzglźdu na mosliwoę usypiania programu obs³uguj¹cego b³źdy stronicowania i mosliwoę wyst¹pienia przerwania w kontekcie dowolnego procesu (nie tylko tego, który utworzy³ bufor), program obs³uguj¹cy przerwania nie mose korzystaę z przestrzeni usytkownika.

copy_to_user(to, from, n)

copy_from_user(to, from, n)

Powyssze procedury przekazuj¹ dane jednokierunkowo miźdzy buforem umieszczonym w przestrzeni usytkownika a j¹drem, oczekuj¹c w razie potrzeby na udostźpnienie stron pamiźci. Trzeci argument w wywo³aniach tych funkcji oznacza liczbź bajtów do skopiowania. Po udanej operacji zwracana jest wartoę zerowa, a w przeciwnym wypadku — liczba bajtów, które jeszcze nie zosta³y skopiowane w momencie pojawienia siź b³źdu. Powszechnie usywa siź tych wywo³ań w nastźpuj¹cy sposób:

if (copy_to_user(buf, result, sizeof(result)))

return -EFAULT; /* Nieprawid³owy adres */

Procedury s¹ usywane w j¹drze Linuksa i prawdopodobnie nie ma potrzeby szczegó³owego ich rozpatrywania. Nalesy tylko pamiźtaę o wymienionych wysej ograniczeniach ich stosowania i o tym, aby nie usywaę ich bez potrzeby.

Architektura kiobuf

W j¹drach z serii 2.2 programy obs³ugi przerwań lub sprzźt korzystaj¹cy z kana³ów DMA nie mog³y uzyskaę bezporedniego dostźpu do buforów umieszczonych w przestrzeni adresowej usytkownika. Nalesa³o kopiowaę dane za pomoc¹ bufora umieszczonego w przestrzeni j¹dra, co w niektórych przypadkach prowadzi³o do zmniejszenia wydajnoci (szczególnie wtedy, gdy sterowniki musia³y kopiowaę duso danych miźdzy urz¹dzeniem i procesem dzia³aj¹cym w przestrzeni usytkownika — np. w kartach buforuj¹cych obraz lub w kartach dwiźkowych).

W czasie opracowywania j¹der z serii 2.3 znaleziono metodź umosliwiaj¹c¹ sterownikom blokowanie stron w przestrzeni usytkownika, dziźki czemu mosna z nich korzystaę przy bezporednim dostźpie bez opisywanych wysej ograniczeń. Metoda ta zosta³a nazwana kiobuf.

Dzia³a to w taki sposób, se najpierw sprawdza siź obecnoę s¹danych stron w pamiźci fizycznej i w razie potrzeby pobiera je z obszaru wymiany, a nastźpnie blokuje siź je — wtedy nie mog¹ one byę ponownie przeniesione do obszaru wymiany lub przesuniźte na inne miejsce. Po wykonaniu takiej operacji dowolny program mose z nich bezpiecznie korzystaę as do momentu ich odblokowania.

Aby usyę w³aciwoci kiobuf, trzeba najpierw przydzielię tablicź zawieraj¹c¹ struktury kiobuf, w których system bździe przechowywa³ dane o odwzorowaniu adresów. S³usy do tego funkcja alloc_kiovec

int alloc_kiovec(int nr, struct kiobuf **bufp);

void free_kiovec(int nr, struct kiobuf **bufp);

Powyssze funkcje przydzielaj¹ i zwalniaj¹ tablicź struktur kiobuf usywan¹ przez „prawdziwe” operacje kiobuf. Przyczyn¹ pos³ugiwania siź strukturami kiobuf w postaci tablicy, a nie pojedynczo, jest umosliwienie ³atwiejszej obs³ugi operacji rozsy³ania (ang. scatter) lub pobierania danych (ang. gather). Kasda struktura kiobuf mose reprezentowaę tylko jeden ci¹g³y zakres adresów, a wiźc aby pos³ugiwaę siź rósnymi obszarami adresowymi pamiźci w pojedynczej operacji przekazu danych, trzeba te struktury pogrupowaę w tablicź (kiovec).

Operacja rozsy³ania lub gromadzenia danych jest pewn¹ postaci¹ bezporedniego dostźpu do pamiźci (DMA), podczas którego urz¹dzenie otrzymuje uporz¹dkowan¹ listź stron, do których maj¹ byę skopiowane dane, a nie pojedynczy adres fizyczny i rozmiar kopiowanego obszaru, jakim pos³ugiwa³y siź starsze urz¹dzenia korzystaj¹ce z DMA. Oznacza to, se j¹dro nie musi jus zajmowaę siź przydzia³em ci¹g³ych obszarów fizycznej pamiźci o dusych rozmiarach i dbaę o utrzymanie tych obszarów w stanie bez fragmentacji.

Po przydzieleniu miejsca na tablicź struktur kiobuf kasda z tych struktur musi zostaę odpowiednio skonfigurowana. Nalesy podaę adres wirtualny i rozmiar obszaru pamiźci, który ma ona reprezentowaę, pozwalaj¹c procedurom zarz¹dzania pamiźci¹ na weryfikacjź istnienia kasdej s¹danej strony oraz sprawdzenie uprawnień do dostźpu. Konfiguracja odbywa siź za pomoc¹ procedury map_user_kiobuf z odpowiednimi parametrami:

int map_user_kiobuf(int rw, struct kiobuf *iobuf,

unsigned long va, size_t len);

Argument rw wskazuje, czy dana struktura bździe wykorzystywana tylko do odczytu, czy takse do zapisu. Wartoę zerowa tego argumentu oznacza tryb tylko do odczytu, za wartoę równa 1 oznacza takse mosliwoę zapisu. Próba uaktywnienia mosliwoci zapisu na stronach, w stosunku do których bies¹cy proces nie ma wystarczaj¹cych uprawnień, spowoduje, se nie powiedzie siź operacja odwzorowania. Inne, mniej oczywiste ograniczenie dzia³ania funkcji map_user_kiobuf polega na tym, se wartoę argumentu va (skrót od virtual address) musi byę dopasowana do rozmiaru strony (czyli musi byę wielokrotnoci¹ rozmiaru strony w danym systemie, zdefiniowanego jako PAGE_SIZE w pliku include/asm/page.h), za rozmiar obszaru adresowanego nie mose przekraczaę 64 kB. Przy korzystaniu z wiźkszych obszarów nalesy pos³ugiwaę siź wieloma strukturami kiobuf.

Po poprawnej konfiguracji struktur kiobuf wskazuj¹cych na wymagany obszar pamiźci trzeba jeszcze zablokowaę ca³y zakres stron w pamiźci fizycznej. S³usy do tego funkcja lock_kiovec

int lock_kiovec(int nr, struct kiobuf *iovec[], int wait);

int unlock_kiovec(int nr, struct kiobuf *iovec[]);

Argument wait podawany dla funkcji lock_kiovec kontroluje jej zachowanie przy braku jakiej strony, wymagaj¹cego pobrania jej z obszaru wymiany. Jeseli wait ma wartoę zerow¹, to funkcja mose zwrócię kod b³źdu -EAGAIN informuj¹cy, se brak wymaganych stron. W przeciwnym wypadku funkcja bździe oczekiwaę na udostźpnienie wszystkich stron, a nastźpnie ich zablokowanie.

Po odwzorowaniu stron pamiźci adres kasdej z nich zawarty w strukturze kiobuf staje siź dostźpny poprzez listź odwzorowanych pól (ang. maplist field), wskazuj¹c¹ na tablicź struktur tych odwzorowanych stron. Kolejn¹ komplikacjź powoduje usycie w najnowszych procesorach firmy Intel tzw. rozszerzenia adresu fizycznego (Physical Address Extension, w skrócie PAE). W takim wypadku strony fizyczne mog¹ mieę adresy mieszcz¹ce siź poza zakresem dostźpnym bezporednio z j¹dra (czyli powysej ok. 4 GB) i pomimo ich faktycznego zablokowania w tym obszarze nalesy sprawdzaę, czy s¹ one odwzorowane w bies¹cym obszarze wirtualnym. Do tego celu s³usy funkcja kmap zwracaj¹ca rzeczywisty adres wirtualny, który mosne byę usywany podczas dostźpu do zablokowanej strony. Po zakończeniu operacji wymagaj¹cej dostźpu nalesy usun¹ę odwzorowanie wirtualne za pomoc¹ funkcji kunmap. Ta para funkcji jest zdefiniowana w pliku include/linux/highmem.h, który mose takse do³¹czaę include/asm/highmem.h

unsigned long kmap(struct page *page);

void kunmap(struct page *page);

Poniewas funkcja kmap w celu zmniejszenia liczby kosztownego przesy³ania stron do obszaru wymiany korzysta z bardzo wymylnych algorytmów dostźpu do obszarów pamiźci wirtualnej (wielokrotnie wykorzystuje wstźpnie przydzielone zakresy adresów pamiźci wirtualnej), mose byę zmuszana do przejcia w stan upienia w oczekiwaniu na zwolnienie wirtualnego adresu. Niewasne, se nie s¹ niezrozumia³e przyczyny takiego dzia³ania tej funkcji — nalesy tylko zapamiźtaę, se mose on byę upiona.

Kod obs³ugi kiobuf dla karty firmy Applicom

Powróęmy teraz do sterownika dla karty firmy Applicom. Aby zabezpieczyę siź przed skutkami dostźpu programu obs³ugi przerwań do karty podczas transmisji danych, w czasie tych operacji trzeba zablokowaę przerwania. Oznacza to, se podczas transmisji danych nie mosna bezporednio korzystaę z dostźpu do bufora usytkownika, czyli nie mosna po prostu skopiowaę pakietu danych z obszaru usytkownika do karty i odwrotnie.

Trzeba wiźc kopiowaę ca³y pakiet albo do bufora poredniego umieszczonego w przestrzeni j¹dra (zwanego „buforem odrzucaj¹cym” ze wzglźdu na sposób wykorzystania go przez dane z niego wchodz¹ce i wychodz¹ce) i nastźpnie blokowaę przerwania podczas transmisji danych z tego bufora do karty, albo wykorzystaę strukturź kiobuf do blokowania bufora usytkownika przed rozpoczźciem transmisji. „Bufory odrzucaj¹ce” (ang. bounce buffers) powoduj¹ znaczny spadek wydajnoci, a wiźc w podanym tu fragmencie kodu funkcji ac_write usyjemy struktur kiobuf.

Najpierw przydzielamy pojedyncz¹ strukturź, poniewas chcemy zablokowaę tylko jeden obszar:

struct kiobuf *iobuf;

ret = alloc_kiovec(1, &iobuf);

if (ret)

return ret;

Jeseli przydzia³ pamiźci siź nie uda, to zwracamy kod b³źdu; w przeciwnym wypadku konfigurujemy odwzorowanie naszej pojedynczej struktury. Jest to nieco sztuczne, poniewas takie odwzorowania zawsze musz¹ pokrywaę siź z granicami stron. Obszar faktycznie odwzorowany w kiobuf rozci¹ga siź wiźc od pocz¹tku pierwszej strony as do końca ostatniej strony w buforze usytkownika. (Usyta nisej struktura mailbox jest przekazywana do urz¹dzenia i pobierana z niego. Wartoę sizeof(struct mailbox) okrela wiźc rozmiar bufora kopiowanego podczas transmisji danych).

bufadr=((unsigned long)buf) & PAGE_MASK;

bufofs=((unsigned long)buf) & ~PAGE_MASK;

ret = map_user_kiobuf(READ, iobuf, bufadr,

sizeof(struct mailbox) + bufofs);

Tutaj w wypadku niepowodzenia takse musimy zwolnię poprzednio przydzielon¹ tablicź kiovec i przekazaę odpowiedni kod b³źdu do programu wywo³uj¹cego:

if (ret)

Jeseli wszystko przebiegnie pomylnie, to natychmiast blokujemy bufor. Wczeniejsze wersje poprawek do j¹dra z serii 2.2 wprowadzaj¹cych strukturź kiobuf nie wymaga³y tej czynnoci, poniewas odwzorowanie równoczenie blokowa³o bufor. W ostatecznej wersji kodu kiobuf w j¹drach z serii 2.4 blokowanie jest wykonywane oddzielnie.

ret = lock_kiovec(1, &iobuf, 1);

if (ret)

Nastźpnie musimy pobraę rzeczywiste adresy, pod którymi znajduj¹ siź odwzorowane i zablokowane strony pamiźci. Na szczźcie wiemy, se potrzebny bździe dostźp tylko do dwóch (i nie wiźcej) stron, poniewas nasz pakiet danych nie przekracza rozmiaru strony (w najgorszym przypadku mose on wiźc zajmowaę pamiźę pod koniec pierwszej strony i na pocz¹tku nastźpnej). Pole nr_pages w iobuf zawiera liczbź odwzorowanych stron.

Jak jus wspomniano wczeniej, przed zablokowaniem przerwań trzeba usyę funkcji kmap do sprawdzenia, czy kasda strona zosta³a odwzorowana w wirtualnym obszarze j¹dra (ze wzglźdu na mosliwoę upienia):

pageadr[0] = kmap(iobuf->maplist[0]);

if (iobuf->nr_pages > 1)

pageadr[1] = kmap(iobuf->maplist[1]);

Po zablokowaniu buforów mosna zablokowaę przerwania i skopiowaę pakiet danych do karty. Funkcja spin_lock_irq blokuj¹ca przerwania zostanie omówiona dalej. Mówi¹c dok³adnie: nalesy sprawdzię, czy urz¹dzenie jest gotowe do przyjźcia danych i jeseli trzeba, odczekaę na osi¹gniźcie jego gotowoci. Kod realizuj¹cy tź operacjź zosta³ tu pominiźty w celu uproszczenia, ale bździe jeszcze omawiany w przyk³adzie obs³ugi kolejki.

spin_lock_irq(&apbs[IndexCard].mutex);

Adres ród³owy jest adresem, pod którym jest odwzorowana pierwsza strona plus przesuniźcie na tej stronie, pod którym znajduje siź pakiet danych. Wartoę tego przesuniźcia (offset) jest obliczana wczeniej, tus przed wywo³aniem funkcji map_user_kiobuf

from = (char *)pageadr[0] + bufofs;

Adres przeznaczenia ma sta³e przesuniźcie wzglźdem adresu, pod którym zosta³ odwzorowany obszar pamiźci na karcie PCI. By³ on okrelony i zarejestrowany przez omawian¹ wczeniej funkcjź apdrv_probe

to = (unsigned long) apbs[IndexCard].VirtIO + RAM_FROM_PC;

Po ustawieniu adresów rozpoczynamy kopiowanie:

for (i = 0; i < sizeof(struct mailbox); i++)

Po zakończeniu operacji kopiowania nalesy zwolnię blokadź i ponownie uaktywnię przerwania

spin_unlock_irq(&apbs[IndexCard].mutex);

a na zakończenie usun¹ę odwzorowanie kasdej strony, odblokowaę i usun¹ę odwzorowanie oraz zwolnię usywan¹ strukturź kiobuf:

kunmap(iobuf->maplist[0]);

if (iobuf->nr_pages > 1)

kunmap(iobuf->maplist[1]);

unlock_kiovec(1, &iobuf);

unmap_kiobuf(iobuf);

free_kiovec(1, &iobuf);

Podstawowe funkcje blokuj¹ce

W j¹drze Linuksa istnieje kilka podstawowych operacji blokuj¹cych, stosowanych w rósnych sytuacjach zgodnie z ich w³aciwociami i ograniczeniami.

Semafory

Najprostszy jest tradycyjny semafor (ang. semaphore), który czźsto wykorzystuje siź jako wzajemnie wykluczaj¹c¹ blokadź pozwalaj¹c¹ rósnym fragmentom kodu wykluczaę siź nawzajem. Oznacza to po prostu blokadź równoczesnego dostźpu do struktur danych lub procedur.

Tradycyjnie semafor zawiera licznik (ang. counter), którego zawartoę jest powiźkszana za pomoc¹ operacji up i zmniejszana za pomoc¹ operacji down. Zawartoę licznika nigdy nie mose staę siź ujemna, wiźc gdy osi¹ga zero, to kasda nastźpna operacja down powoduje upienie wywo³uj¹cego j¹ procesu as do momentu, gdy jaki inny proces wywo³a operacje up. Jeseli operacja up nie nast¹pi, procesy próbuj¹ce wywo³aę operacje down bźd¹ usypiane na zawsze.

Implementacja semafora w Linuksie zazwyczaj polega na wprowadzeniu funkcji obs³uguj¹cych operacje up i down — o takich w³anie nazwach. S¹ one zdefiniowane w pliku include/asm/semaphore.h, ³¹cznie ze struktur¹ danych semaphore s³us¹c¹ do przechowywania licznika i innych wykorzystywanych wewnźtrznie informacji o stanie:

void down(struct semaphore *sem);

void up(struct semaphore *sem);

Zanim struktura semaphore zostanie usyta, nalesy j¹ zainicjowaę. Zazwyczaj stosowane s¹ do tego celu funkcje init_MUTEX lub init_MUTEX_LOCKED, które nadaj¹ wartoci danym wewnźtrznym i kasuj¹ zawartoci liczników, nadaj¹c im odpowiednio wartoci 0 i 1:

struct semaphore MySem, MySem2;

init_MUTEX(&MySem);

init_MUTEX_LOCKED(&MySem2);

Jeseli semafor dysponuje statycznie przydzielon¹ pamiźci¹ (czyli gdy struktura semaphore ma zasiźg globalny, a nie lokalny wewn¹trz funkcji), to jako alternatywnego sposobu inicjacji mosna usyę makropoleceń DECLARE_MUTEX i DECLARE_MUTEX_LOCKED zamiast deklarowania struktury sempahore. Powysszy przyk³ad w takim wypadku ma nastźpuj¹c¹ postaę:

DECLARE_MUTEX (MySem);

DECLARE_MUTEX_LOCKED(MySem2);

Po poprawnym zainicjowaniu semafora do obs³ugi blokady mosna usyę funkcji up i down. Trzeba przy tym pamiźtaę, se operacja down w czasie oczekiwania na blokadź powoduje upienie procesu wywo³uj¹cego oraz wywo³uje funkcjź j¹dra o nazwie schedule która pozwala temu procesowi na korzystanie z CPU. Poniewas nie jest dozwolone ustalanie kolejnoci czasowej operacji w programie obs³ugi przerwań, oznacza to, se taki program nie mose pos³ugiwaę siź funkcj¹ down. Mose natomiast korzystaę z funkcji up bez ograniczeń, poniewas nigdy nie powoduje ona upienia procesu, który j¹ wywo³a³.

Jest jeszcze inna funkcja dzia³aj¹ca na semaforach, z której mosna skorzystaę wówczas, gdy program wywo³uj¹cy nie mose byę usypiany. Jest to funkcja down_trylock, która próbuje zmniejszyę wartoę licznika w semaforze i zwraca kod b³źdu (wartoę niezerow¹), jeli nie uda siź tego zrobię natychmiast (czyli gdy licznik ma jus wartoę równ¹ zeru).

int down_trylock(struct semaphore *sem);

Blokady pźtlowe

Do wzajemnego wykluczania procesów w j¹drze usywane s¹ takse blokady pźtlowe (ang. spinlocks), ale rósni¹ siź one znacznie od semaforów. Podczas oczekiwania na uzyskanie blokady proces nie zaniecha korzystania z CPU, ale bździe (zgodnie z nazw¹ spinlock) w kó³ko nźka³ CPU sprawdzaj¹c stan tej blokady as do jej ewentualnego uzyskania. Oznacza to, se blokada pźtlowa mose byę usywana w programie obs³uguj¹cym przerwania oraz se blokady powinny trwaę bardzo krótko. Dodatkowo, proces podtrzymuj¹cy blokadź pźtlow¹ nigdy nie powinien zaprzestaę korzystania z CPU, poniewas gdyby inny fragment kodu próbowa³ uzyskaę blokadź, mog³oby to spowodowaę ca³kowity paralis i zawieszenie systemu (nowa blokada nie mog³aby siź pojawię i nie mosna by³oby przestaę korzystaę z CPU w celu zwolnienia pierwszej blokady).

Blokady pźtlowe s¹ deklarowane za pomoc¹ typu spinlock_t i przed usyciem musz¹ byę zainicjowane za pomoc¹ funkcji spin_lock_init. Do uzyskiwania i zwalniania blokady pźtlowej usywane s¹ odpowiednio funkcje spin_lock i spin_unlock. Ich definicje s¹ umieszczone w pliku include/linux/spinlock.h, który do³¹cza takse plik include/asm/spinlock.h

void spin_lock(spinlock_t *lock);

void spin_unlock(spinlock_t *lock);

Poniewas blokady pźtlowe mog¹ byę usywane w programie obs³ugi przerwań, to powstaj¹ dalsze komplikacje. Mog³oby doję do zawieszenia systemu w sytuacji, gdyby w czasie dzia³ania blokady pźtlowej wyst¹pi³o przerwanie, a program obs³ugi przerwania próbowa³by uzyskaę tź sam¹ blokadź. Dlatego w³anie przy wywo³ywaniu blokady pźtlowej, która mose byę takse wywo³ywana z programu obs³ugi przerwań, nalesy wy³¹czaę przerwania w lokalnym procesorze (czyli w procesorze, który pierwotnie wywo³a³ funkcjź spin_lock). Próby jednoczesnego uzyskania tej blokady pźtlowej przez rósne procesory nie powoduj¹ sadnych skutków ubocznych. Kolejne dwie funkcje zapewniaj¹ wymagany w takich przypadkach poziom zabezpieczeń; s¹ to spin_lock_irq oraz spin_unlock_irq s³us¹ce do blokowania i odblokowywania przerwań w lokalnym procesorze podczas uzyskiwania blokady pźtlowej.

void spin_lock_irq(spinlock_t *lock);

void spin_unlock_irq(spinlock_t *lock);

Wielka blokada j¹dra

Gdy próbowano uruchamiaę system Linux na maszynie wieloprocesorowej, korzystaj¹c z j¹dra z rozwojowej serii 1.3, usywano bardzo prostej i zarazem bardzo nieefektywnej blokady. By³a to pojedyncza blokada zwana ”wielk¹” (Big Kernel Lock, w skrócie BKL). Zabezpiecza³a ona system przed jednoczesn¹ prac¹ dwóch procesorów w trybie chronionym. Proces dzia³aj¹cy na pierwszym procesorze i wywo³uj¹cy funkcjź systemow¹ w czasie, gdy drugi procesor jus korzysta³ z j¹dra, musia³ czekaę na zwolnienie dostźpu do j¹dra. Taka blokada stosowana jest takse i dzisiaj, ale obecnie wiźksza czźę kodu przesta³a byę chroniona za jej pomoc¹, co umosliwia j¹dru znacznie lepsze wykorzystanie architektury wieloprocesorowej. W kodzie inicjuj¹cym j¹dra z serii 2.4 oraz w kodzie obs³ugi systemów plików blokada BKL jest nadal utrzymywana przez wiźksz¹ czźę czasu. Mosna j¹ takse uzyskaę w wielu wywo³aniach systemowych. Wiźkszoę sterowników urz¹dzeń nie korzysta jednak z BKL poza swoimi funkcjami inicjuj¹cymi. Takie rozwi¹zanie poprawia wprawdzie wydajnoę j¹der z serii 2.4 na maszynach wieloprocesorowych, ale jednoczenie zmusza do przestrzegania zasad „wieloprocesorowoci” w sterownikach urz¹dzeń i nie dopuszczania do sytuacji „cigania”.

Blokada j¹dra ma charakter szczególny, poniewas jest ona automatycznie zwalniana, gdy proces zaniecha korzystania z CPU i ponownie aktywowana, gdy proces wznawia dzia³anie. Powszechnie pope³nianym b³źdem jest w tym przypadku wywo³ywanie funkcji, która mose byę upiona, np. copy_from_user lub kmalloc, w czasie, gdy blokada BKL jest utrzymywana i zak³adanie, se blokada nigdy nie bździe zwolniona. Jest to za³osenie fa³szywe — jak wynika z powysszego opisu.

Wiźcej szczegó³ów na temat blokad dostźpnych w j¹drze Linuksa, oprócz ksi¹ski Paula Russella Unreliable Guide To Locking, mosna znaleę pod adresem: https://www.samba.org/netfilter/unreliable-guides/kernel-locking/lklockingguide.html.

Planowanie zadań i kolejki

Bywa tak, se sterownik musi czekaę na co, co ma nast¹pię. W ogólnym przypadku usycie sygna³ów busy lub cykli oczekiwania procesora nie jest dobrym rozwi¹zaniem, poniewas procesor mose ten czas powiecię na wykonanie innych operacji. Nalesy wiźc upię proces i spowodowaę, aby siź obudzi³ o odpowiedniej porze.

schedule()

Funkcja schedule, której prototyp znajduje siź w pliku include/linux/sched.h jest wywo³ywana wówczas, gdy proces chce przej¹ę CPU. Kod j¹dra Linuksa nie mose byę wyw³aszczany, a wiźc jedyn¹ metod¹ przeniesienia kodu poza procesor jest po prostu przeniesienie go poza listź zaplanowanych zadań oczekuj¹cych w kolejce, przy czym tego przeniesienia musi dokonaę sam kod. Nie dotyczy to chwilowych przerwań, czyli np. przerwań generowanych przez sprzźt. Wywo³ana funkcja schedule zachowuje zawartoę rejestrów CPU i wówczas mose on bez przeszkód wykonywaę kod innych procesów. Jeli wywo³uj¹cy proces „powraca” do CPU (zazwyczaj w wyniku „obudzenia” go przez funkcjź, której wynik by³ oczekiwany), to wywo³ana funkcja schedule przywraca zachowan¹ zawartoę rejestrów i przekazuje sterowanie do funkcji, z której zosta³a wywo³ana. Oprócz pewnego opónienia wszystko przebiega wiźc tak, jakby siź nic nie sta³o.

void schedule(void);

set_current_state()

Po wywo³aniu funkcji schedule kod mose byę ponownie wprowadzony na listź zadań po up³ywie krótkiego czasu, czyli po tym, jak inne procesy uzyska³y dostźp do CPU na odpowiedni okres. Mose okazaę siź przydatne wykonanie tej operacji samemu, np. w sytuacji, gdy procesor zajmuje siź intensywnymi obliczeniami i nie chcemy, aby by³ nźkany przez inne procesy.

Znacznie czźciej mamy do czynienia z sytuacj¹, gdy kod oczekuje na zewnźtrzne zdarzenie i nie powinien byę ponownie wstawiany na listź zadań, jeli to zdarzenie nie nast¹pi. W takim przypadku mosna nadaę kodowi status kodu unieruchomionego i to zabezpieczy go przed ponownym przekazaniem do procesora. S³usy do tego makropolecenie set_current_state. Pocz¹tkowo bźd¹ dla nas interesuj¹ce jedynie trzy stany. Pe³na lista stanów znajduje siź w pliku include/linux/sched.h

TASK_RUNNING	Jest to normalny stan dla procesów, które mog¹ byę uruchamiane.
TASK_UNINTERRUPTIBLE	Stan unieruchomienia. Proces musi byę obudzony w specjalny sposób.
TASK_INTERRUPTIBLE	Stan unieruchomienia, lecz z mosliwoci¹ automatycznego przejcia ponownie do stanu TASK_RUNNING jeli pojawi siź sygna³.

schedule_timeout()

Zwykle wymaga siź, aby sterownik czeka³ na jakie zdarzenie, ale wstawia siź tu ograniczenie czasu tego oczekiwania (tzw. timeout). Do ustawiania tego ograniczenia s³usy funkcja schedule_timeout, wymagaj¹ca podania jednego argumentu oznaczaj¹cego graniczny okres oczekiwania. Argument ten jest podawany w postaci liczby cykli zegarowych. D³ugoę tego cyklu w jednostkach czasu zalesy od systemu, ale istnieje takse w pliku include/asm/param.h makrodefinicja HZ okrelaj¹ca liczbź cykli na sekundź. Dla 32-bitowych procesorów firmy Intel jest to zazwyczaj 100, co oznacza, se jeden cykl trwa 10 ms. W komputerach z procesorem Alpha wartoę HZ wynosi 1024, co daje d³ugoę jednego cyklu równ¹ w przybliseniu 1 ms.

Funkcja schedule_timeout zwraca albo zero, jeseli s¹dany czas up³yn¹³, albo liczbź cykli pozosta³¹ w momencie obudzenia procesu za pomoc¹ innych metod (wyjanimy to za chwilź).

signed long schedule_timeout(signed long timeout);

wake_up()

Dowiedzielimy siź jus, w jaki sposób mosna upię proces, a wiźc nadesz³a kolej na informacjź o budzeniu. W Linuksie s³usy do tego specjalna konstrukcja zwana kolejk¹ (tzw. wait queue). Zanim pi¹cy proces zostanie oddany do dyspozycji CPU, sam musi weję do kolejki procesów oczekuj¹cych na przebudzenie za pomoc¹ okrelonego zdarzenia. Nastźpnie, jeseli to zdarzenie nast¹pi, jakikolwiek kod odpowiedzialny za odbiór powiadomień o zdarzeniach (najczźciej jest to program obs³ugi przerwań) wywo³uje funkcjź wake_up która prze³¹cza stan wszystkich oczekuj¹cych procesów do wartoci TASK_RUNNING i umieszcza je ponownie w terminarzu w kolejce procesów mosliwych do uruchomienia.

„Czo³o” kolejki jest deklarowane jako wielkoę typu wait_queue_head_t i musi zostaę zainicjowane przed usyciem za pomoc¹ funkcji init_waitqueue_head. Podobnie jak przy semaforach i blokadach pźtlowych, istnieje tu mosliwoę zastosowania deklaracji statycznej, jednoczenie deklaruj¹cej i inicjuj¹cej strukturź. Taka deklaracja ma nastźpuj¹c¹ postaę:

DECLARE_WAIT_QUEUE_HEAD(name);

Mosna j¹ zastosowaę zamiast:

wait_queue_head_t name;

init_waitqueue_head(&name);

Elementy s¹ zdefiniowane w pliku include/linux/wait.h

Sama funkcja wake_up jest w rzeczywistoci makropoleceniem wywo³uj¹cym funkcjź __wake_up z dodatkowym argumentem. Odwasni czytelnicy mog¹ siź przyjrzeę jej definicji podanej w pliku include/linux/sched.h, ale w zasadzie wystarcza informacja, se jest ona definiowana jako:

void wake_up(wait_queue_head_t *q);

add_wait_queue()

Zanim proces bździe móg³ zostaę obudzony, nalesy umiecię go w kolejce oczekiwania. W tym celu trzeba zadeklarowaę strukturź typu wait_queue_t, nastźpnie zainicjowaę j¹, nadaj¹c jej wartoę tak¹, jak¹ ma struktura zadania bies¹cego procesu i do³¹czyę j¹ do kolejki. Odbywa siź to w nastźpuj¹cy sposób:

wait_queue_t wait;

init_waitqueue_entry(&wait, current);

add_wait_queue(&name, &wait0;

Tutaj takse mosna usyę skróconej deklaracji i inicjacji wait_queue_t

DECLARE_WAITQUEUE(wait, current);

Makrodefinicjź current nalesy traktowaę jako zmienn¹ globaln¹, która zawsze wskazuje na strukturź danych zadania wykonywanego przez bies¹cy proces. W tym momencie wystarczy tylko wiedzieę, se jest ona typu struct task_struct * Szczźliwie (lub nie) siź sk³ada, se pasuje do prototypu funkcji init_waitqueue_entry oraz jest zdefiniowana w pliku include/linux/sched.h

void init_waitqueue_entry(wait_queue_t *q, struct task_struct *p);

void add_wait_queue(wait_queue_head_t *q, wait_queue_t * wait);

remove_wait_queue()

Po obudzeniu procesu nalesy usun¹ę z kolejki wpis, który go dotyczy. Ma to zapobiec sytuacjom, w których ten sam proces by³by ponownie budzony przez inne wyst¹pienie tego samego zdarzenia. Usuniźcie procesu z kolejki odbywa siź za pomoc¹ funkcji remove_wait_queue, która wymaga podania dok³adnie takich samych argumentów jak funkcja add_wait_queue

void remove_wait_queue(wait_queue_head_t *q, wait_queue_t * wait);

sleep_on() i „wycigi”

Istnieje prosta funkcja, która grupuje kilka wysej opisanych funkcji. Dziźki temu mosna wstawię proces do kolejki i upię go, wywo³uj¹c za pomoc¹ tylko tego jednego wywo³ania. Funkcja ma nazwź sleep_on i wymaga podania jednego argumentu: adresu czo³a kolejki. Istnieje równies odmiana tej funkcji dla usypiania w stanie TASK_INTERRUPTIBLE, a takse dla przypadku, gdy potrzebne jest zastosowanie schedule_timeout zamiast schedule

Autor ma zamiar wyjanię sposób jej dzia³ania, poniewas jest to dobry przyk³ad tego, se nie nalesy usywaę kolejek, jeli kod ma byę bezpieczny. Jest to prosta odpowied na pytanie, czy nalesy stosowaę funkcjź sleep_on. W rzeczywistoci, Linus Thorvalds zgodzi³ siź na ca³kowite jej usuniźcie z kodu rozwojowej serii j¹der 2.5.

Oto kod funkcji sleep_on (mosna go znaleę w pliku kernel/sched.c, tutaj jest podany z niewielkimi przestawieniami):

void sleep_on(wait_queue_head_t *q)

Wszystko wygl¹da bardzo ³adnie, ale czźsto funkcja ta bywa wywo³ywana w nastźpuj¹cy sposób:

while (!event_happened)

sleep_on(event_wait_queue);

Rozwasmy teraz, co siź stanie, gdy zdarzenie i wywo³anie wake_up wyst¹pi¹ na innym procesorze miźdzy sprawdzeniem i wywo³aniem sleep_on. Powysszy prociutki kod zostanie po prostu upiony, nawet gdyby zdarzenie faktycznie jus nast¹pi³o. Pozostanie on w stanie upienia, chyba se zdarzenie wyst¹pi powtórnie. W maszynie jednoprocesorowej nie ma to zbyt wielkiego znaczenia, ale jeli funkcja wake_up jest wywo³ywana przez program obs³uguj¹cy przerwania, to takie zjawisko mose wystźpowaę w podatnym na zaburzenia okresie miźdzy sprawdzeniem i wywo³aniem sleep_on

Nalesy wiźc spowodowaę, aby proces sam przenosi³ siź do kolejki, potem sprawdzaę status zdarzenia i w razie potrzeby wywo³ywaę funkcjź schedule. Nastźpnie, jeseli wyst¹pi wywo³anie wake_up po sprawdzeniu tego stanu, bździe ono przenosię proces ponownie do stanu TASK_RUNNING, za wywo³anie schedule bździe udostźpniaę go procesorowi jedynie w krótkim przedziale czasu.

Trzeba zwrócię uwagź na to, aby obowi¹zkowo ustawiaę proces w stan TASK_INTERRUPTIBLE zanim on sam przeniesie siź do kolejki— w przeciwnym wypadku zdarzenie mog³oby wyst¹pię przed wejciem procesu do kolejki i upię go na zawsze.

Po tych ostrzeseniach na temat funkcji sleep_on oraz pokrewnych interruptible_sleep_on sleep_on_timeout i interruptible_sleep_on_timeout nalesa³oby zapewne podaę przyk³ady ich bezpiecznego usycia.

Przede wszystkim, jeseli zarówno kod upiony, jak i kod obudzony s¹ zabezpieczone za pomoc¹ wielkiej blokady j¹dra (BKL), to mosna bezpiecznie korzystaę ze wspomnianych funkcji. Blokada nie bździe w takim wypadku zwalniana as do chwili, gdy funkcja sleep_on wywo³a schedule, dziźki czemu wywo³anie wake_up nie pojawi siź w czasie usypiania procesu. Dotyczy to znacznej czźci kodu obs³ugi systemu plików w j¹drach z serii 2.4, ale mose ulec powasnej zmianie w rozwojowej serii 2.5. Nawet w tym wyj¹tku mosna znaleę dodatkowe odstźpstwo — pomiźdzy sprawdzeniem stanu a wywo³aniem funkcji sleep_on nie wolno robię niczego, co mog³oby upię proces i spowodowaę dziźki temu chwilowe zdjźcie blokady j¹dra. Do tych niedozwolonych operacji nalesy dostźp do obszaru pamiźci usytkownika oraz niektóre wywo³ania kmalloc opisane wczeniej w podrozdziale powiźconym BKL.

Powrót do sterownika karty Applicom

Sterownika karty firmy Applicom nie mosna zaliczyę do tej grupy, dla której mosna bezpiecznie usyę funkcji sleep_on, a wiźc musimy w nim sami odpowiednio obs³usyę oczekiwanie w kolejkach. Powoduje to koniecznoę dopisania dodatkowego kodu do wczeniej pokazanego przyk³adu sterownika korzystaj¹cego ze struktur kiobuf.

Po zablokowaniu i odwzorowaniu bufora usytkownika nie wykonujemy dalszych operacji, jak to by³o robione we wczeniej podanym przyk³adzie, ale musimy zaczekaę as urz¹dzenie bździe gotowe na przyjźcie pakietu danych. Jeseli kopiowanie danych do bufora urz¹dzenia odby³oby siź na lepo w momencie, gdy urz¹dzenie nie jest gotowe do odbioru, to stracilibymy zarówno dane, jak i czas procesora.

Po uzyskaniu blokady pźtlowej i zablokowaniu przerwań przenosimy wiźc bies¹ce zadanie do kolejki, w której przebywaj¹ zadania chc¹ce wpisaę dane do urz¹dzenia:

set_current_state(TASK_INTERRUPTIBLE);

add_wait_queue(&apbs[IndexCard].FlagSleepSend, &wait);

Usyjemy teraz pźtli dzia³aj¹cej do momentu, gdy urz¹dzenie zasygnalizuje gotowoę do przyjźcia danych, czyli po odczycie wartoci zerowej z rejestru DATA_FROM_PC_READY. Musimy czekaę dopóty, dopóki nie pojawi siź tam wartoę zerowa. Nalesy zwrócię uwagź, se w tym przypadku wasne jest usycie okrelonego rejestru w tym szczególnym urz¹dzeniu. Wiźkszoę kart peryferyjnych ma podobne rejestry s³us¹ce do sprawdzania gotowoci na przyjźcie lub pobranie danych:

while (readb(apbs[IndexCard].VirtIO + DATA_FROM_PC_READY) != 0)

Jeli wyeliminujemy mosliwoę wyst¹pienia sygna³u, to uzyskujemy pewnoę, se urz¹dzenie mose siź komunikowaę ze wiatem zewnźtrznym. Nie wolno jednak natychmiast przes³aę do niego danych, poniewas na tak¹ okazjź mose czekaę wiźcej procesów, które osi¹gnź³y podobny stan. Ponownie w³¹czamy wiźc blokadź pźtlow¹ i przechodzimy na pocz¹tek pźtli while. Jeseli inny proces dotar³ do tego punktu wczeniej, ponowne uzyskanie blokady pźtlowej zajmie mu trochź czasu. Do chwili, gdy nie obs³usymy tego procesu, urz¹dzenie bździe ponownie zajźte, a wiźc trzeba bździe zwolnię blokadź pźtlow¹ i ponownie czekaę.

spin_lock_irq(&apbs[IndexCard].mutex);

Powyssze instrukcje kończ¹ pźtlź while. W momencie dojcia do tego miejsca w kodzie wiemy, se utrzymujemy blokadź pźtlow¹ zabezpieczaj¹c¹ urz¹dzenie przed dostźpem i se jest ono gotowe na przyjźcie naszego pakietu danych.

Proces sam usuwa siź z kolejki i ustawia stan zadania na wartoę TASK_RUNNING, jeseli karta by³a gotowa w momencie pierwszego sprawdzenia. Nie musimy czekaę na przerwanie, zatem mosemy wykonaę nastźpuj¹ce zadania:

set_current_state(TASK_RUNNING);

remove_wait_queue(&apbs[IndexCard].FlagSleepSend, &wait);

Dopiero teraz mosna skopiowaę pakiet danych do urz¹dzenia, jak w poprzednim przyk³adzie; po tej operacji po raz ostatni trzeba zwolnię blokadź pźtlow¹.

Licznik wywo³ań w module

Kolejny b³¹d powszechnie pope³niany przez osoby programuj¹ce j¹dro dotyczy obs³ugi licznika wywo³ań modu³u. Zasada dzia³ania modu³u z takim licznikiem jest bardzo prosta. Kasdy modu³ przechowuje liczbź odnosz¹cych siź do niego wywo³ań, a gdy osi¹gnie ona zero, modu³ mose byę bezpiecznie usuniźty. Do obs³ugi tych liczników s¹ stosowane dwa makropolecenia o nazwach MOD_DEC_USE_COUNT i MOD_INC_USE_COUNT. Sterownik usyty jako modu³ powinien dbaę o to, aby zliczenie jego wywo³ań nie sta³o siź równe zeru przez czas, gdy do jego kodu lub zawartych w nim struktur danych mose siź odwo³aę j¹dro.

W j¹drach z serii 2.2 do powiźkszenia zawartoci licznika odwo³ań stosowano powszechnie funkcjź open, za do jej zmniejszania — funkcjź release. Przed wywo³aniem której z tych funkcji j¹dro powinno uzyskaę blokadź BKL, która zabezpiecza modu³ przed usuniźciem podczas dzia³ania wywo³anej funkcji (poniewas funkcja powoduj¹ca usuniźcie modu³u takse wymaga³a blokady BKL). Oczywicie, nie zapominajmy takse, se dopóty modu³ nie mose byę usuniźty, dopóki wykonuje co, co mose pozostawaę w stanie upienia.

Najczźciej stosowany by³ podany nisej kod:

int my_driver_open(struct inode *inode, struct file *filp)

Rozwasmy teraz, co siź stanie, jeli funkcja kmalloc musi zostaę upiona podczas s¹dania przydzia³u pamiźci i jeli podczas jej upienia inny proces próbuje usun¹ę modu³. Przy powrocie z wywo³ania funkcja kmalloc nie znajdzie jus funkcji, która j¹ wywo³a³a (bo ta zosta³a usuniźta) i wówczas nast¹pi BUM!

Poprawnym rozwi¹zaniem tego problemu w j¹drach z serii 2.2 jest celowe powiźkszenie wartoci zliczeń, a nastźpnie ich zmniejszenie, jeli wydarzy siź co niew³aciwego. Oprócz tego trzeba pamiźtaę, se proces usuwania modu³u przebiega dwuetapowo i jeseli funkcja module_exit mose byę upiona, to modu³ mose zostaę usuniźty, jeli by³ zaznaczony do usuniźcia przed wywo³aniem funkcji open. W j¹drach z tej serii nie mosna temu zapobiec, co najwysej mosna tylko powiedzieę: „Nie usypiaj procesów w funkcji oczyszczaj¹cej modu³”.

Aby zapobiec takim sytuacjom, w j¹drach z serii 2.4 wprowadzono now¹ funkcjź o nazwie try_inc_mod_count. Zwraca ona wartoę 1 w wypadku udanego powiźkszenia zawartoci licznika wywo³ań lub 0, jeli modu³ jest jus zaznaczony do usuniźcia. W odrósnieniu od makropolecenia MOD_INC_USE_COUNT funkcja try_inc_mod_count wymaga podania wskanika do struktury informacyjnej modu³u, którego licznik ma byę obs³usony. W kodzie modu³u jest to zawsze zmienna o sta³ej wartoci i nazwie __this_module

Bezpieczna wersja wysej podanego kodu ma wiźc nastźpuj¹c¹ postaę:

int my_driver_open(struct inode *inode, struct file *filp)

filp->private_data = priv;

return 0;

Obs³uga licznika wywo³ań w j¹drach z serii 2.2 dla karty firmy Applicom jest bardzo prosta, poniewas funkcje open i release nie robi¹ niczego wiźcej. Przy kasdym otwarciu urz¹dzenia zawartoę licznika wywo³ań jest powiźkszana, natomiast przy kasdym zamkniźciu — licznik wywo³ań zmniejsza swoj¹ zawartoę:

static int ac_open(struct inode *inode, struct file *filp)

static int ac_release(struct inode *inode, struct file *filp)

W j¹drach z serii 2.4 staje siź to jeszcze prostsze, poniewas funkcje open i release nie s¹ zupe³nie potrzebne. J¹dro Linuksa w wersji próbnej 2.4.0-test4 automatycznie powiźksza zawartoę licznika wywo³ań przed wywo³aniem funkcji open i zmniejsza tź zawartoę po wywo³aniu funkcji release. Zosta³o to zmienione po to, aby umosliwię eliminacjź blokady BKL w celu podwysszenia wydajnoci Linuksa przy powiźkszaniu liczby procesorów.

Mówi¹c janiej: w j¹drach z serii 2.4 nie wymaga siź, aby prosty sterownik manipulowa³ swoim w³asnym licznikiem wywo³ań przy wywo³aniach jego funkcji open i release, za w kodzie tych funkcji nie trzeba jus dbaę o utrzymanie blokady BKL w czasie ich dzia³ania.

Budowanie sterownika

Nadesz³a chwila, gdy po napisaniu kodu trzeba w³¹czyę sterownik do konfiguracji j¹dra i skompilowaę go. Polega to na dodaniu odpowiedniej opcji konfiguracyjnej do j¹dra i dopisaniu do plików makefile instrukcji, które bźd¹ odpowiedzialne za kompilacjź nowego sterownika po uaktywnieniu odpowiedniej opcji.

Opcje konfiguracyjne

Najpierw nalesy ustalię nazwź nowej opcji konfiguracyjnej. Istniej¹ce nazwy mosna przejrzeę, uruchamiaj¹c polecenie make config w hierarchii plików ród³owych j¹dra. Obowi¹zkowo nalesy nadaę nowej opcji nazwź, która wi¹se siź w jaki sposób z nowym sterownikiem i nie koliduje z nazw¹ istniej¹c¹. W przypadku kart firmy Applicom autorzy wybrali CONFIG_APPLICOM — nazwa ta spe³nia wszystkie wymagania. Aby udostźpnię tź opcjź, nalesy dopisaę j¹ do listy opcji zawartej w pliku Config.in umieszczonym w podkatalogu ze sterownikami. W naszym przypadku sterownik jest urz¹dzeniem znakowym, a wiźc nazwź opcji nalesy dopisaę do pliku drivers/char/Config.in. Format tego pliku jest zupe³nie prosty i ³atwo jest w nim uzalesnię wybór nowej opcji od wyboru dokonanego poprzednio.

Najprostszym sposobem zadeklarowania nowej opcji konfiguracyjnej jest deklaracja bool, jak w podanym nisej przyk³adzie:

bool 'Direct Rendering Manager (XFree86 DRI support)' CONFIG_DRM

Dziźki takiej deklaracji usytkownik konfiguruj¹cy j¹dro mose wybraę „Yes” lub „No”. Taki wpis jest stosowany dla kodu, który nie bździe dzia³a³ jako modu³ ³adowany na syczenie (np. jak modu³ oszczźdzania energii) i w kilku innych sytuacjach. Przyk³adowo: opcja CONFIG_NET_ETHERNET nie dotyczy kodu bezporednio, lecz jeli usytkownik odpowie „No”, to uzyska mosliwoę indywidualnego wyboru sterowników dla rósnych typów kart sieciowych obs³ugiwanych przez system Linux.

Czźciej stosuje siź deklaracjź tristate, która umosliwia wybór jednej z trzech odpowiedzi powszechnie spotykanych przy konfiguracji j¹dra: „Yes No” i „Module”. Odpowied „Yes” oznacza statyczne wkompilowanie kodu sterownika do j¹dra, za „No” i „Module” maj¹ oczywiste znaczenie.

Czźsto wybór kolejnej opcji musi byę uzalesniony od opcji wybranych poprzednio. Przyk³adowo: nie mosna usyę sterownika karty Applicom, jeseli nie zosta³a w³¹czona obs³uga magistrali PCI, a wiźc odpowied „Y” na pierwsze pytanie (przy wczeniejszym udzieleniu odpowiedzi „N” na pytanie drugie) jest ca³kowicie pozbawiona sensu. Jeseli by³aby mosliwa kompilacja sterowników obs³uguj¹cych PCI jako modu³ów ³adowanych na s¹danie, to poprawnymi odpowiedziami dla CONFIG_APPLICOM by³yby „M” albo „N”, ale nigdy „Y” (kod sterownika karty Applicom zalesy bowiem od kodu PCI i nie mose dzia³aę samodzielnie).

Uwzglźdnianie takich zalesnoci u³atwia deklaracja dep_tristate i ona w³anie nadaje siź do naszego sterownika:

dep_tristate 'Applicom intelligent fieldbus card support' CONFIG_APPLICOM

$CONFIG_PCI

Powyssza dyrektywa powoduje, se usytkownik bździe móg³ wybraę opcjź CONFIG_APPLICOM zalesnie od poprzednio ustawionej opcji CONFIG_PCI. Mog³oby to stanowię precyzyjne ograniczenie mosliwoci wkompilowania sterownika karty Applicom w j¹dro, gdyby nie by³a w³¹czona obs³uga PCI. Nalesy jednak za³osyę, se kod PCI jest w³¹czany za pomoc¹ deklaracji typu „Yes No” (poniewas nikt chyba nie podj¹³by siź przekszta³cię go na postaę modu³ow¹) — powysszy przyk³ad jest wiźc chyba zbyt wymylny.

Pliki makefile

Po zadeklarowaniu nowej opcji konfiguracyjnej nalesy zmienię pliki makefile w taki sposób, aby kompilacja nowego sterownika przebiega³a zgodnie z syczeniem usytkownika.

Pliki makefile dla j¹dra Linuksa s¹ obecnie ca³kowicie zmieniane w celu pozbycia siź z nich wywo³ań rekurencyjnych. Oznacza to, se wprowadza siź pojedyncze drzewo zalesnoci zamiast wielu oddzielnych drzew umieszczonych w rósnych katalogach. Napisano nawet artyku³ uzasadniaj¹cy takie podejcie, ale tutaj nie bździemy go cytowaę, odsy³aj¹c zainteresowanego Czytelnika pod adres https://www.tip.net.au/~millerp/rmch/recu-make-cons-harm.html.

Obecnie w j¹drach z serii 2.4 nadal stosowane jest podejcie rekurencyjne i w zwi¹zku z tym nalesy zmodyfikowaę plik makefile w katalogu, w którym umieszczono kod ród³owy sterownika.

Ogólnie mówi¹c, modyfikacja ta polega na dopisaniu nazwy pliku obiektowego (applicom.o) do odpowiedniej listy plików obiektowych tworzonych podczas kompilacji. Wszystko zaczyna siź wiźc nieco komplikowaę.

Jeseli nowy sterownik ma dzia³aę jako modu³, to jego nazwa powinna byę dopisana do zmiennej M_OBJS. Jeli sterownik ma byę wkompilowany w j¹dro, nalesy sprawdzaę, czy z katalogu tworzone jest archiwum lub pojedynczy plik obiektowy, w sk³ad którego wchodz¹ wszystkie znajduj¹ce siź w nim pliki obiektowe. Jeseli jest zdefiniowana zmienna L_TARGET, to bździe tworzone archiwum i wówczas nalesy dopisaę nazwź sterownika do zmiennej L_OBJS. Z drugiej strony, jeseli w pliku makefile zdefiniowano zmienn¹ O_TARGET, powstanie pojedynczy plik obiektowy — wtedy nazwź sterownika nalesy dopisaę do zmiennej O_OBJS

Jeseli sterownik eksportuje nazwy symboliczne usywane przez inne modu³y, czego tutaj raczej nie wymagamy, to zmienia siź wszystko. Nazwź sterownika nalesy wówczas dodaę odpowiednio do jednej ze zmiennych MX_OBJS LX_OBJS albo OX_OBJS

Wszystkie opcje konfiguracyjne s¹ importowane jako zmienne do procesu make, wiźc modyfikacje w pliku makefile mog¹ wygl¹daę jak w ponisszym przyk³adzie:

ifeq ($(CONFIG_APPLICOM),y)

L_OBJS += applicom.o

else

ifeq ($(CONFIG_APPLICOM),m)

M_OBJS += applicom.o

endif

Podejmuj¹c próbź uproszczenia tej konfiguracji, zmienilimy niektóre pliki makefile (³¹cznie z plikami w katalogu drivers/char, w którym znajduje siź nasz przyk³adowy sterownik). Zmodernizowane pliki makefile nadal tworz¹ takie same jak poprzednio pliki wynikowe, lecz ca³y proces tworzenia list plików obiektowych zosta³ u³atwiony. Jeseli tworzony plik obiektowy musi eksportowaę symboliczne nazwy, to nalesy je dopisaę do zmiennej export-list (niezalesnie od tego, czy dotyczy to modu³u, czy nie). Trzeba takse dopisaę je albo do zmiennej obj-m, albo do obj-y. Po tych modyfikacjach do³¹czenie sterownika karty Applicom daje siź zapisaę w jednym wierszu:

obj-$(CONFIG_APPLICOM) += applicom.o

Niektóre pliki makefile zosta³y jus zmodernizowane. Nalesy oczekiwaę, se w fazie tworzenia j¹dra z rozwojowej serii 2.5 wszystkie stare pliki zostan¹ zast¹pione wersjami zmodernizowanymi. Obecnie trzeba trochź wiedzieę na temat plików makefile i podj¹ę decyzje na temat sposobu dodania w³asnego sterownika w odpowiednie miejsce. Nie nalesy siź zbytnio obawiaę zmian — jeseli dok³adnie przyjrzymy siź tym plikom i regu³om konfiguracji, ³atwo da siź zauwasyę miejsce, w którym trzeba dopisaę wiersze pasuj¹ce do danego sterownika. Jeli zadalimy sobie tyle wysi³ku, aby utworzyę sterownik, to cz³onkowie listy dyskusyjnej zajmuj¹cej siź j¹drem Linuksa prawdopodobnie bardzo chźtnie pomog¹ w jego odpowiedniej konfiguracji.

Co zrobię z nowym sterownikiem?

Po zakończeniu prac nad nowym sterownikiem nadejdzie prawdopodobnie chwila zastanowienia siź, co dalej z nim mosna zrobię. Spotyka siź dwa rozwi¹zania tego dylematu:

q Mosna umiecię swój kod zgodnie z zasadami licencji dotycz¹cymi j¹dra systemu Linux (czyli GPL),

q Mosna rozpowszechniaę swój sterownik tylko w postaci binarnej.

Wybór zalesy od praw w³asnoci intelektualnej, którym podlega kod sterownika. Jeseli informacje usyte do jego napisania wymagaj¹ przestrzegania wy³¹cznoci, to wybór jest ograniczony przez tak¹ umowź.

Przed podjźciem decyzji nalesy zapoznaę siź z okreleniami stosowanymi w Publicznej Licencji GNU (GPL), na podstawie której jest rozpowszechniane j¹dro systemu Linux. Gwarantuje ona usytkownikom prawo do otrzymania i modyfikacji kodu ród³owego dowolnego programu, który jest wkompilowany w j¹dro Linuksa. Jeseli do sterownika nie do³¹cza siź kodu ród³owego, mosna go rozpowszechniaę tylko jako modu³ ³adowany na syczenie, czyli nie wolno wkompilowaę go w j¹dro. Jest prawdopodobne, se taki modu³ mose nie dzia³aę w systemie o takiej samej architekturze i z j¹drem o takiej samej wersji, jakich usyto przy jego kompilacji. Wynika to zarówno z mosliwoci usycia rósnych opcji konfiguracyjnych, jak i np. stosowania innego kompilatora. Nie decyduj¹c siź na rozpowszechnianie kodu ród³owego, jestemy ograniczani koniecznoci¹ tworzenia rósnych wersji sterownika spe³niaj¹cych wymagania rósnych usytkowników.

Oprócz tego, usytkownicy takiego sterownika nie mog¹ spodziewaę siź pomocy ani od zespo³u programistów tworz¹cych j¹dro Linuksa, ani od wielu firm komercyjnych. Po otrzymaniu raportu o dostrzesonych b³źdach, pochodz¹cego od usytkownika pos³uguj¹cego siź sterownikiem rozpowszechnianym tylko w postaci binarnej, pierwsz¹ odpowiedzi¹ bywa prawie zawsze rada, aby usytkownik spróbowa³ powtórnie uzyskaę b³źdne dzia³anie bez takiego sterownika. Jeseli w takim przypadku problem nie wyst¹pi, to nikt wiźcej nie bździe siź nim zajmowa³.

Sam Linus Thorvalds wyjani³ bardzo dobitnie swoje pogl¹dy na ten temat w lutym 1999 r. w wiadomoci przes³anej do zespo³u programistów zajmuj¹cych siź j¹drem:

Przede wszystkim chcia³bym, aby osoby pos³uguj¹ce siź modu³ami dostźpnymi tylko w wersji binarnej zrozumia³y, se jest to tylko ich W£ASNY problem. Chcia³bym, aby zapamiźtali to raz na zawsze i chcia³bym wykrzyczeę to na ca³y wiat. Chcia³bym, aby budzili siź zlani zimnym potem ci, którzy korzystaj¹ z binarnych modu³ów.

Dlatego w³anie usilnie zalecamy, aby kasde nowe sterowniki korzysta³y z licencji GPL i by³y przesy³ane do Linusa w celu do³¹czenia ich do oficjalnego wydania j¹dra. Wówczas usytkownicy sterownika nie tylko mog¹ oczekiwaę na wsparcie dla swoich systemów, ale takse na poprawź najdrobniejszych b³źdów w miarź rozwoju Linuksa i zmian dokonywanych w jego wewnźtrznych interfejsach programowych.

Jak zg³osię nowy sterownik?

Aby zg³osię Linusowi nowy sterownik, nalesy najpierw upewnię siź, se daje siź on poprawnie kompilowaę i dzia³a poprawnie z najnowsz¹ rozwojow¹ wersj¹ j¹dra. Jeseli mosna go wkompilowac w j¹dro lub usyę jako modu³u, to obydwie konfiguracje takse musz¹ zostaę sprawdzone.

Programici zajmuj¹cy siź od niedawna Linuksem powszechnie pope³niaj¹ b³¹d polegaj¹cy na przekonaniu, se wszyscy syj¹ tylko w wiecie komputerów typu PC. Linux dzia³a na wielu platformach, ³¹cznie z procesorami 64-bitowymi i pos³uguj¹cymi siź odmiennym porz¹dkiem bajtów, a wiźc zawsze istnieje mosliwoę, se kto zechce skorzystaę ze sterownika w³anie na takiej maszynie. Jeseli sterownik jest przeznaczony dla karty PCI, to mose byę usywany na maszynach wieloprocesorowych, a wiźc nalesy go na takich maszynach przetestowaę — szczególnie dotyczy to zmiany porz¹dku bajtów i rozmiaru s³owa procesora. Do platform obs³uguj¹cych karty PCI nales¹ oprócz IA32 (x86) takie procesory, jak Alpha, PowerPC, IA64, SPARC, UltraSPARC i inne. Jeseli programista nie ma dostźpu do takich maszyn, powinien znaleę osoby chźtne do testowania na jakiej licie dyskusyjnej. Chźtni znajduj¹ siź zazwyczaj bardzo szybko, szczególnie gdy sterownik jest przeznaczony dla produktu komercyjnego i mosna dostarczyę do testowania ca³¹ kartź.

Po uzyskaniu pewnoci, se sterownik dzia³a na wszystkich platformach i we wszystkich konfiguracjach, nalesy wprowadzię poprawkź (patch) dodaj¹c¹ go do nienaruszonej kopii najnowszej rozwojowej wersji j¹dra. Najprociej mosna zrobię tak¹ ³¹tkź, kopiuj¹c czyste j¹dro do jednego katalogu, a nastźpnie do drugiego i do jednego z j¹der do³¹czyę swój nowy sterownik. Potem wystarczy usyę polecenia diff

diff -uNr linux-clean linux-patched

W ten w³anie sposób powstanie ³atka. Najwasniejsz¹ czźci¹ powysszego polecenia jest opcja -u (lub --unified), która s³usy do wyboru formatu zalecanego przez Linusa i innych twórców j¹dra. Dziźki tej opcji mosna ³atwiej dostosowaę poprawkź do innych ³atek i ³atwiej zrozumieę, o co w niej chodzi.

Po utworzeniu ³atki nalesy jej usyę na czystym j¹drze, przebudowaę je i ponownie przetestowaę. Zdarza siź, se w tym momencie programista stwierdza brak jakiego wasnego pliku, który by³ do³¹czany z roboczej hierarchii katalogów, albo se do³¹czono pliki ca³kowicie bezusyteczne. Ca³y proces tworzenia ³atki trzeba wówczas powtórzyę.

Jeli ³atka dzia³a poprawnie, powinni j¹ przetestowaę takse inni usytkownicy. Jeli nie ma ona wielkich rozmiarów, to mosna wys³aę j¹ bezporednio na listź dyskusyjn¹ dla programistów zajmuj¹cych siź j¹drem na adres linux-kernel@vger.rutgers.edu z prob¹ o opiniź. Jeli rozmiary ³atki s¹ duse, nalesy j¹ udostźpnię na serwerze FTP i wys³aę na listź podobn¹ informacjź, podaj¹c miejsce jej przechowywania. Aby korzystanie z listy by³o przyjemniejsze, nalesy przed wys³aniem informacji zapoznaę siź ze zbiorem najczźciej zadawanych pytań i uzyskanych odpowiedzi (FAQ) znajduj¹cym siź pod adresem https://www.tux/org/lkml/.

Dopiero po uzyskaniu pozytywnych opinii i zapoznaniu siź z raportami o wykrytych b³źdach lub z uwagami krytycznymi nades³anymi na listź dyskusyjn¹ na temat proponowanego sterownika mosna pomyleę o wys³aniu ³atki do Linusa. £atka ta powinna byę umieszczona w treci listu, a nie do³¹czona w formacie MIME. W licie nalesy takse podaę krótki opis w³aciwoci nowego sterownika. Jeseli kto chce wys³aę wiadomoę w formacie HTML, powinien od razu o tym zapomnieę.

Od tego momentu trzeba cierpliwie czekaę. Linus jest wyj¹tkowo zapracowanym cz³owiekiem i akceptowanie poprawek doprowadzi³ do stanu doskona³oci. Jeli programista zg³aszaj¹cy sterownik ma wyj¹tkowe szczźcie, to jego ³atka zostanie zaakceptowana lub odrzucona za pierwszym podejciem. Jeseli nie, to trzeba byę przygotowany na powtórki zwi¹zane z poprawkami. Warto takse przy kasdej wysy³ce ³atki do Linusa skierowaę kopiź wiadomoci na listź dyskusyjn¹.

Podsumowanie

Omówilimy tu kilka zagadnień interesuj¹cych osoby zajmuj¹ce siź programowaniem j¹dra, lecz nie wyczerpuje to ca³ego tematu. W rzeczywistoci do omówienia pozosta³o znacznie wiźcej, nis mosna zmiecię w tej ksi¹sce. To, co pokazalimy, stanowi jednak niezbźdne podstawy przy budowaniu w³asnego sterownika urz¹dzenia PCI.

Do momentu wydania tej ksi¹ski trzeba by³o wszystkiego szukaę w dokumentacji (chocias teraz takse jest to konieczne, jak stwierdzi³ jeden z autorów). Ca³kiem sporo materia³u mosna znaleę w podkatalogu Documentation umieszczonym w hierarchii plików ród³owych j¹dra, a takse, co jest oczywiste, w ksi¹sce Alessandro Rubiniego pt. Linux Device Drivers (ISBN 1-56592-292-1) — nie porusza ona jednak problemów wystźpujacych w j¹drach z serii 2.4.

Politica de confidentialitate | Termeni si conditii de utilizare

DISTRIBUIE DOCUMENTUL

Vizualizari: 730
Importanta:

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Distribuie URL
https://www.scrigroup.com/limba/poloneza/313/Sterowniki-urzdze84124.php

Adauga cod HTML in site
<a href="https://www.scrigroup.com/limba/poloneza/313/Sterowniki-urzdze84124.php" target="_blank" title=" - https://www.scrigroup.com/limba/poloneza/313/Sterowniki-urzdze84124.php">Sterowniki urz¹dzeń</a>

Sterowniki urz¹dzeń

komputerów

DOCUMENTE SIMILARE

Sterowniki urz¹dzeń

Kontekst dzia³ania

Modu³ i kod inicjuj¹cy

Sekcje konsolidatora

Przyk³adowy kod modu³u

Urz¹dzenia i sterowniki magistrali PCI

Struktura pci_dev

Wyszukiwanie urz¹dzeń PCI

Przeszukiwanie rźczne

Sterowniki PCI

Funkcje dostźpu do urz¹dzeń PCI

Przydzia³ zasobów

Obs³uga przerwań

Kod sterownika PCI modu³u Applicom

Dostźp do pamiźci w obszarze usytkownika

Architektura kiobuf

Kod obs³ugi kiobuf dla karty firmy Applicom

Podstawowe funkcje blokuj¹ce

Semafory

Blokady pźtlowe

Wielka blokada j¹dra

Planowanie zadań i kolejki

schedule()

set_current_state()

schedule_timeout()

wake_up()

add_wait_queue()

remove_wait_queue()

sleep_on() i „wycigi”

Powrót do sterownika karty Applicom

Licznik wywo³ań w module

Budowanie sterownika

Opcje konfiguracyjne

Pliki makefile

Co zrobię z nowym sterownikiem?

Jak zg³osię nowy sterownik?

Podsumowanie

DISTRIBUIE DOCUMENTUL

Comenteaza documentul:

sleep_on() i „wycigi”