Първоначално създадох това като кратък списък с теми за учене, за това как се става софтуерен инженер, но то прерасна в този огромен списък, който виждате в момента. След като преминах през този учебен план, бях нает като софтуерен инженер в Amazon! Най-вероятно няма да Ви се налага да учите колкото на мен, но все пак всичко, от което се нуждаете е тук.
Учих между 8-12 часа на ден в продължение на няколко месеца. Това е историята ми: Why I studies full-time for 8 months for a Google interview
Моля обърнете внимание: Няма да Ви се налага да учите колкото мен. Загубих много време, учейки неща, които нямах нужда да знам. Може да прочетете повече за това надолу. Ще Ви помогна да достигнете до крайната цел без да прахосвате скъпото си време.
Темите, изредени тук, ще Ви подготвят добре за техническо интервю за почти всяка една компания, включително гигантите Amazon, Facebook, Google и Microsoft
Пожелавам Ви успех!
Преводи:
Текущи преводи:
Това е моят многомесечен план за ставане на софтуерен инженер към голяма компания.
Изисквания:
- Малко опит с програмиране (променливи, цикли, методи/функции и т.н)
- Търпение
- Време
Обърнете внимание, че това е учебен план за софтуерно инженерство, а не за уеб разработка. Големите компании като Google, Amazon, Facebook и Microsoft различават софтуерното инженерство и уеб разработката. Amazon, например, имат Frontend инженери (FEE) и Software Development инженери (SDE). Това са 2 отделни позиции и интервютата за тях няма да са еднакви, тъй като всяка една от тях има своите специфики. Тези компании изискват знания по компютърни науки за позиции свързани със софтуерно инженерство/разработка
- Какво е това?
- Защо да го ползвате?
- Как да го ползвате?
- Не мислете, че не сте достатъчно умни
- Бележка за видео ресурсите
- Изберете език за програмиране
- Книги за структури от данни и алгоритми
- Книги за подготовка за интервю
- Не повтаряйте грешките ми
- Какво няма да намерите тук
- Дневния план
- Подготовка за въпроси за програмиране
- Задачи по програмиране
- Алгоритмична сложност / Big-O / Асимптотичен анализ
- Структури от данни
- Повече знания
- Дървета
- Дървета - бележки & основи
- Дървета за двоично търсене: BSTs (Binary search trees)
- Heap / Priority Queue / Binary Heap
- балансирани дървета за търсене (основна концепция, без детайли)
- обхождане: preorder, inorder, postorder, BFS, DFS
- Сортиране (Sorting)
- selection
- insertion
- heapsort
- quicksort
- merge sort
- Графи (Graphs)
- directed
- undirected
- adjacency matrix
- adjacency list
- traversals: BFS, DFS
- Още повече знания
- Рекурсия (Recursion)
- Динамично програмиране (Dynamic programming)
- Design Patterns
- Комбинаторика & вероятности
- NP, NP-Complete and Approximation Algorithms
- Как компютрите обработват една програма
- Кеширане (Caches)
- Процеси и нишки
- Тестване (Testing)
- String searching & manipulations
- Tries
- Floating Point Numbers
- Уникод (Unicode)
- Endianness
- Мрежи (Networking)
- Последен преглед
- Актуализирайте резюмето си
- Намерете позиция
- Процесът на интервюто & обща подготовка
- Мислете за това, когато дойде интервюто
- Подгответе въпроси за интервюиращия
- След като са Ви наели
---------------- Всичко оттук надолу е по желание ----------------
- Допълнителни книги
- Системен дизайн, мащабируемост, обработка на данни (ако имате над 4 години опит)
- Additional Learning
- Компилатори
- Emacs and vi(m)
- Unix command line tools
- Information theory
- Паритет & код на Хаминг
- Ентропия
- Криптография
- Компресия
- Компютърна сигурност
- Garbage collection
- Паралелно програмиране
- Системи за съобщения, сериализация и последователност
- A*
- Fast Fourier Transform
- Bloom Filter
- HyperLogLog
- Locality-Sensitive Hashing
- van Emde Boas Trees
- Разширени структури от данни
- Балансирани дървета за търсене
- AVL trees
- Splay trees
- Red/black trees
- 2-3 search trees
- 2-3-4 Trees (aka 2-4 trees)
- N-ary (K-ary, M-ary) trees
- B-Trees
- k-D Trees
- Skip lists
- Мрежови потоци
- Disjoint Sets & Union Find
- Математика за бърза обработка
- Treap
- Линейно програмиране
- Geometry, Convex hull
- Дискретна математика
- Machine Learning
- Допълнителни детайли по някои теми
- Видео серии
- Курсове по компютърни науки
- Papers
Ако искате да работите като софтуерен инженер в голяма компания, това са нещата, които трябва да знаете.
Ако също като мен не сте учили компютърни науки в университет това ще Ви помогне да наваксате и ще Ви спести години.
Когато започнах този проект не знаех какво е стек или опашка, нямах представа какво е Big-O, не знаех нищо за дървета или как да обхождам графи. Ако трябваше да напиша сортиращ алгоритъм мога да Ви кажа, че бих се справил ужасно. Всяка от структурите от данни, които бях използвал досега бяха имплементирани в езика, който ползвах и нямах представа как работят реално. Никога не ми се беше налагало да управлявам памет освен ако някой от процесите, които бях пуснал не връщаха грешка "out of memory"- тогава се налагаше да търся заобиколен път. Бях ползвал хиляди асоциативни масиви и многоизмерни масиви няколко пъти, но никога преди не бях имплементирал структури от данни от нулата.
Планът е дълъг. Може да Ви отнеме месеци. Ако вече сте запознати с повечето от темите ще Ви отнеме много по-малко
Всичко надолу е само схематично изложение и трябва да преминете през темите от горе до долу.
- Успешните софтуерни инженери са умни, но много имат чувството, че не са достатъчно умни
- Митът за гениалния програмист
- Опасно е да сте сами: битката с невидимите чудовища в IT
Някои видеа са достъпни само след записване в курс на Coursera или EdX- т.нар. MOOCs. Понякога се налага да изчакате няколко месеца, за да стартира ново издание на курса, така че няма да имате достъп до тях.
Би било чудесно такива ресурси да бъдат заменени с безплатни и свободнодостъпни публични източници като YouTube видеа (по възможност университетски лекции), за да могат всички да учат навсякъде и по всяко време, а не само когато даден курс върви в момента.
Трябва да изберете език за програмиране за интервютата на които ще се явявате, но също така трябва да изберете език, който можете да ползвате за учене на концепции от компютърните науки.
Желателно е този език да е един и същ, така ще Ви се налага да владеете само един език.
Когато преминавах през учебния план ползвах 2 езика за по-голямата част от нещата: C и Python
- C: Език на много ниско ниво. Дава Ви възможност да се справяте с пойнтъри и управляване на паметта, за да разберете структурите от данни и алгоритмите на много дълбоко ниво. В езици за програмиране на по-високо ниво тези неща са скрити от Вас. В ежедневната работа това е прекрасно, но когато се учите как тези структури от данни работят е хубаво да усещате как става всичко.
- C е навсякъде. Ще виждате примери в книги, лекции, видеа навсякъде докато учите.
- The C Programming Language, Vol 2
- Това е кратка книга, но ще Ви даде добра представа за езика и с малко упражнения бързо ще имате добро владение над него. Ако разбирате C значи разбирате как програмите и паметта работят.
- Не трябва да се зачитате много надълбоко в книгата (или дори да я прочитате докрай). Нужно е само да сте уверени в способността си да четете и пишете в C.
- Отговори на въпросите в книгата
- Python: модерен и много експресивен. Научих го защото е наистина много полезен и ми позволява да пиша по-малко код когато съм на интервю.
Това е моя личен избор. Вие можете да изберете каквото пожелаете, разбира се.
Може да не Ви трябват, но ето някои сайтове за учене на нов език:
Може да изберете език, в който се чувствате комфортно за интервюто Ви, но за големите компании това са най-добрите опции:
- C++
- Java
- Python
Може да ползвате и тези, но поразгледайте преди това, защото може да има уловки:
- JavaScript
- Ruby
Това е статия, която написах за избирането на език за вашето интервю: Pick One Language for the Coding Interview. Това е оригиналната статия, на която базирах моя пост: http://blog.codingforinterviews.com/best-programming-language-jobs/
Трябва да се чувствате много удобно с вашия език и да сте знаещи.
Повече за вариантите:
Вижте ресурси за специфични езици тук
Тази книга ще положи вашата основа в компютърните науки.
Просто изберете една в език, с който ще се чувствате комфортно. Ще трябва да четете и да пишете код доста.
- Algorithms in C, Parts 1-5 (Bundle), 3rd Edition
- Основни познания, структури от данни, сортиране, търсене и алгоритми за графи
- Data Structures and Algorithms in Python
- от Goodrich, Tamassia, Goldwasser
- Тази книга ми допадна много. Покрива всичко и още нещо
- 'Питоничен' код
- Докладът ми за тази книга: https://startupnextdoor.com/book-report-data-structures-and-algorithms-in-python/
Изборът е ваш:
- Goodrich, Tamassia, Goldwasser
- Sedgewick and Wayne:
- Algorithms
- Безплатен курс в Coursera, който покрива материала от книгата (воден от писателите!):
Изборът е ваш:
- Goodrich, Tamassia, and Mount
- Sedgewick and Wayne
Няма нужда да купувате цял куп от тези книги. Честно казано "Cracking the Coding Interview" най-вероятно ще Ви бъде достатъчна, но аз си купих повече, за да се упражня по-добре. Но аз винаги правя прекалено много.
Купих тези двете, дадоха ми предостатъчно упражнение.
- Programming Interviews Exposed: Coding Your Way Through the Interview, 4th Edition
- Отговори в C++ и Java
- Това е добра подготовка за "Cracking the Coding Interview"
- Не е прекалено сложна. Повечето проблеми са по-лесни от тези, които ще срещнете на интервю (от това, което аз съм прочел)
- Cracking the Coding Interview, 6th Edition
- отговори в Java
Изберете една:
- Elements of Programming Interviews (C++ version)
- Elements of Programming Interviews in Python
- Elements of Programming Interviews (Java version) - Companion Project - Method Stub and Test Cases for Every Problem in the Book
Този списък се разрасна с времето и да, нещата излязоха извън контрол.
Споделям някои от грешките, които направих, за да имате по-добро преживяване и за да си спестите месеци с време.
Изгледах часове с клипове и водих записки за всичко, но след месеци имаше доста неща, които не си спомнях. Прекарах 3 дена преразглеждайки бележките си, за да си припомня някои неща. Не се нуждаех от всичките тези знания.
Моля, прочетете това, за да не повторите грешките миЛ
Да запазваме знания свързани с компютърни науки.
За да се справя с проблема си направих малък сайт за флаш карти, където можех да добавям 2 вида карти: общи и такива с код. Всяка карта има ралично форматиране. Направих сайта mobile-first, за да мога да ги разглеждам от телефона или таблета си, навсякъде където съм.
Направете свои безплатно:
НЕ ПРЕПОРЪЧВАМ да ползвате моите флаш карти. Има прекалено много и някои от тях съдържат информация, която не е нужно да знаете.
Но ако не искате да ме послушате, ето:
- Базата ми от данни с флаш карти (1200 карти):
- Базата ми от данни с флаш карти (екстремно - 1800 карти):
Забележете, че аз прекалих и имам карти, които покриват всичко от assembly language и Python Trivia до machine learning и статистика. Прекалено много е за това, което се изисква.
Бележка за флаш картите: Първия път когато видите, че знаете отговора, не я отбелязвайте като "позната". Трябва да видите същата карта и отговора няколко пъти, преди наистина да знаете отговора. Повторението ще накара мозъка Ви наистина да запамети знанието.
ТОВА Е МНОГО ВАЖНО.
Почнете да решавате задачи от интервюта по програмиране докато учите структури от данни и алгоритми.
Трябва да прилагате това, което учите като решавате задачи иначе ще забравите. Аз направих тази грешка.
Когато сте научили някоя тема и се чувствате що годе комфортно с нея, например linked lists:
- Отворете една от книгите за интервю за програмиране (или един от сайтовете със задачи, изредени по-долу)
- Решете 2-3 задачи свързани с linked lists.
- Продължете към следващата тема.
- По-късно се върнете и отново решете 2-3 задачи свързани с linked lists.
- Повтаряйте това с всяка нова тема, която учите.
Продължавайте да решавате задачи докато учите всичко това, а не след това.
Няма да ви наемат за знанията, които имате, а за това как ги прилагате.
Има много ресурси свързани с това надолу. Продължавайте да четете.
Има много неща, които могат да отвлекат вниманието Ви и да Ви загубят ценно време. Да сте концентрирани е трудно. Пуснете си музика без текст и ще можете да се фокусирате сравнително добре.
Това са широко разпространени технологии, но не и част от учебния план:
- SQL
- Javascript
- HTML, CSS, и други front-end технологии
Този курс преминава през множество от теми. Всяка от тях най-вероятно ще Ви отнеме няколко дена или дори седмица, или повече. Зависи от графика Ви.
Всеки ден взимайте следващата тема в списъка, изгледайте няколко клипа по тази тема и след това напишете имплементацията на въпросната структура от данни или алгоритъм в езика за програмиране, който сте избрали за този курс.
Можете да видите моя код тук:
Не е нужно да помните всеки алгоритъм наизуст. Необходимо е просто да ги разбирате достатъчно добре, за да можете да напишете собствена имплементация.
Защо това е тук? Аз не съм готов да се явя на интервю.
Тогава се върни и прочети това.
Защо трябва да се упражнявате да решавате задачи по програмиране:
- Разпознаване на проблеми и знанието кога и къде да ползвате дадена структура от данни или алгоритъм
- Събиране на изискванията за задачата
- Изговаряне на мислите Ви докато решавате както ще правите на интервюто
- Писане на код върху дъска или лист хартия вместо на компютър
- Намиране на времевата и пространствената сложност на решенията Ви (вижте Big-O надолу)
- Тестване на решенията Ви
Пишете код на дъска или лист хартия вместо на компютър. Тествайте с няколко различни входни данни. След това го напишете и тествайте на компютър.
Ако нямате дъска за писане вкъщи можете да си купите голям тефтер от магазин за арт материали. Можете просто да седите на дивана и да се упражнявате. Това е моята "дъска за дивана". Добавих химикала към снимката за съпоставка на размера. Ако използвате химикал бързо ще ви се поиска да можеше да триете написаното- бързо става мазало. Аз ползвам молив и гума.
Когато се упражнявате да решавате задачи по програмиране не трябва да помните решенията наизуст.
Не забравяйте основните книги за подготовка за интервюто по програмиране тук
Решаване на задачи:
Клипове за задачи от интервюта по програмиране:
- IDeserve (88 клипа)
- Tushar Roy (5 плейлисти)
- Супер за насоки за решаване на задачи
- Nick White - LeetCode Solutions (187 клипа)
- Добро обяснение на решението и кода
- Можете да изгледате няколко клипа в малък прозорец от време
- FisherCoder - LeetCode Solutions
Сайтове със задачи:
- LeetCode
- Любимият ми сайт със задачи. Струва си парите за абонамент за времето, в което ще се подготвяте.
- Вижте клиповете на Nick White и FisherCoder Videos по-горе за насоки със някои задачи.
- HackerRank
- TopCoder
- Geeks for Geeks
- InterviewBit
- Project Euler
Добре, стига сме говорили, нека да учим!
Но не забравяйте да решавате задачи от източниците по-горе докато учите!
- Няма нищо за имплементация тук, единствено ще гледате клипове и ще си водите записки! Йей!
- Има доста клипове тук. Просто изгледайте достатъчно докато не го разберете. Винаги можете да се върнете обратно и да преговорите.
- Не се притеснявайте ако не разбирате всичката математика, която стои отзад.
- Трябва просто да можете да изразите сложността на даден алгоритъм чрез Big-O
- Harvard CS50 - Asymptotic Notation (клип)
- Big O Notations (общ наръчник) (клип)
- Big O Notation (и Omega, и Theta) - най-доброто математично обяснение (клип)
- Skiena:
- UC Berkeley Big O (клип)
- Амортизиран анализ (клип)
- TopCoder (includes recurrence relations and master theorem):
- Пищови
- [Review] Big-O notation in 5 minutes (video)
Е, това е достатъчно за тази тема.
Когато четете "Cracking the Coding Interview" ще срещнете главата, която разглежда тази тема. Накрая на главата има кратък тест, който проверява дали можете да намерите сложността на различни алгоритми. Това е супер преговор и тест.
-
- За масивите:
- Arrays (клип)
- UC Berkeley CS61B - Linear and Multi-Dim Arrays (клип) (Start watching from 15m 32s)
- Dynamic Arrays (клип)
- Jagged Arrays (клип)
- Имплементирайте вектор (променлив масив с автоматично преоразмеряване):
- Упражнявайте се да пишете код, ползвайки масиви и пойнтъри. Ползвайте пойнтъри за преместване към индекс вместо индексиране
- New raw data array with allocated memory
- can allocate int array under the hood, just not use its features
- start with 16, or if starting number is greater, use power of 2 - 16, 32, 64, 128
- size() - номер на елементите
- capacity() - номер на елементите, които може да побира
- is_empty()
- at(index) - връща елемента на дадения индекс, ако индекса е извън границите на масива връща грешка
- push(item)
- insert(index, item) - вкарва елемента на дадения елемент, измествайки съществуващия елемент на този индекс и всички елементи след него надясно
- prepend(item) - може да добавя елементи на индекс 0
- pop() - премахва елемент от края и връща стойността му
- delete(index) - изтрива елемента на дадения индекс и измества всички елементи след него наляво
- remove(item) - търси стойността на елемента и премахва всички индекси, които я съдържат
- find(item) - търси стойността на елемента и връща първия индекс, който я съдържа, или -1 ако няма такъв елемент
- resize(new_capacity) // private function
- когато достигнете максималния обем, преоразмерете като дублирате обема
- когато pop-вате елемент, ако обема на масива е 1/4 от капацитета му, преоразмерете масива наполовина
- Време
- O(1) за добавяне/премахване към края, индексиране или актуализиране
- O(n) за добавяне/премахване другаде
- Пространство
- contiguous in memory, so proximity helps performance
- нужно място = (капацитета на масива, който е >= n) * размера на елемента, но дори 2n, пак е O(n)
- За масивите:
-
- Описание:
- Код в C (клип) - не цялото видео, само частите за Node structs и алокация на памет
- Свързани списъци срещу масиви:
- Защо да избягваме свързаните списъци (клип)
- Аха: трябват Ви pointer to pointer знания: (за да можете да подавате pointer към функция, която може да промени адреса, към който сочи pointer-a) Тази страница служи само да схванете ptr to ptr. Не препоръчвам този стил на обхождане на списъка. Четливостта и поддържаемостта страдат заради хитрости.
- Имплементация:
- size() - връща броя на елементите
- empty() - булева стойност, връща true ако списъка е празен
- value_at(index) - връща стойността на n-тия елемент (почвайки от 0 за първия елемент)
- push_front(value) - добавя стойност към началото на списъка
- pop_front() - премахва първия елемент и връща стойността му
- push_back(value) - добавя елемент към края
- pop_back() - премахва последния елемент и връща стойността му
- front() - взима стойността на първия елемент
- back() - взима стойността на последния елемент
- insert(index, value) - вкарва елемента на дадения индекс, така че новия елемент да сочи към стария елемент на този индекс
- erase(index) - изтрива node-а на дадения индекс
- value_n_from_end(n) - връща стойността на node-а, седящ на позиция n от края на списъка
- reverse() - обръща списъка
- remove_value(value) - премахва първия елемент от списъка, съдържащ тази стойност
- Двойно свързан списък
- Описание (клип)
- Няма нужда от имплементация
-
- Стекове (клип)
- [Review] Stacks in 3 minutes (video)
- Няма нужда да се имплементира. Имплементацията с масив е тривиална.
-
- Опашка (клип)
- Circular buffer/FIFO
- [Review] Queues in 3 minutes (video)
- Имплементирайте със свързан списък с tail pointer:
- enqueue(value) - добавя стойност на опашката
- dequeue() - връща стойността и премахва най-предния елемент на опашката (front)
- empty()
- Имплементрайте с масив с фиксирана големина:
- enqueue(value) - добавя елемента в края на наличното пространство
- dequeue() - връща стойността и премахва най-предния елемент на опашката
- empty()
- full()
- Разход:
- лоша имплементация, ползвайки свързан списък където правим enqueue в началото и dequeue в края би била O(n) защото ще се нуждаете от предпоследния елемент, което ще предизвиква цялостно обхождане при всяко dequeue
- enqueue: O(1) (amortized, свъзран списък и масив [probing])
- dequeue: O(1) (свъзран списък и масив)
- empty: O(1) (свъзран списък и масив)
-
-
Клипове:
- Hashing with Chaining (клип)
- Table Doubling, Karp-Rabin (клип)
- Open Addressing, Cryptographic Hashing (клип)
- PyCon 2010: The Mighty Dictionary (клип)
- PyCon 2017: The Dictionary Even Mightier (клип)
- (Advanced) Randomization: Universal & Perfect Hashing (клип)
- (За напреднали) Perfect hashing (клип)
- [Review] Hash tables in 4 minutes (video)
-
Онлайн курсовe:
-
Имплементирайте с масив, ползвайки linear probing
- hash(k, m) - m е размера на хеш таблицата
- add(key, value) - ако ключа съществува актуализирайте стойността
- exists(key)
- get(key)
- remove(key)
-
-
- Binary Search (клип)
- Binary Search (клип)
- детайли
- [Review] Binary search in 4 minutes (video)
- Имплементирайте:
- двоично търсене (на сортиран масив от integers)
- двоично търсене чрез рекурсия
-
- Bits cheat sheet - трябва да знаете доста от степените на 2 от (2^1 до 2^16 и 2^32)
- Бъдете сигурни, че разбирате добре битовата манипулация: &, |, ^, ~, >>, <<
- 2s and 1s complement
- Преброяване на набор от битове
- Размяна на стойности:
- Абсолютна стойност:
-
- Серия: Дървета (клип)
- основна структура на дървото
- обхождане
- алгоритми за манипулиране
- BFS(обхождане в ширина) and DFS(обхождане в дълбочина) (клип)
- бележки за BFS:
- level order (BFS, using queue)
- времева сложност O(n)
- пространствена сложност: в най-добрия случай: O(1), в най-лошия случай: O(n/2)=O(n)
- бележки за DFS:
- времева сложност: O(n)
- пространствена сложност: в най-добрия случай: O(log n) - средна височина на дървото в най-добрия случай: O(n)
- inorder (DFS: ляво, self, дясно)
- postorder (DFS: ляво, дясно, self)
- preorder (DFS: self, ляво, дясно)
- бележки за BFS:
- [Review] Breadth-first search in 4 minutes (video)
- [Review] Depth-first search in 4 minutes (video)
- [Review] Tree Traversal (playlist) in 11 minutes (video)
-
- Преговор над двоични дървета за търсене (клип)
- Въведение (клип)
- MIT (клип)
- C/C++:
- Двоично дърво за търсене - имплементация в C/C++ (клип)
- BST имплементация - memory allocation in stack and heap (клип)
- Намиране на мин. и макс. елемент в двоично дърво за търсенея (клип)
- Намиране на височината на двоично дърво (клип)
- Обхождане на двоично дърво - стратегии за обхождане по ширина и по дълбочина (клип)
- Двоично дърво: преминаване на порядъка на ниво (клип)
- Обхождане на двоично дърво: Preorder, Inorder, Postorder (клип)
- Проверка дали двоично дърво е двоично дърво за търсене (клип)
- Изтриване на възел от двоично дърво за търсене (клип)
- Редовен наследник в двоично дърво (клип)
- Имплементирайте:
- insert // вкарване на стойност в дървото
- get_node_count // вземане на бройката на запазените стойности
- print_values // принтира стойностите в дървото от най-малкия до най-големия
- delete_tree
- is_in_tree // връща true ако дадената стойност съществува в дървото
- get_height // returns the height in nodes (single node's height is 1)
- get_min // връща най-малката стойност, съхранявана в дървото
- get_max // връща най-голямата стойност, съхранявана в дървото
- is_binary_search_tree
- delete_value
- get_successor // връща следващата най-голяма стойност след дадената, -1 ако такава не съществува
-
- визуализира се като дърво, но обикновенно е линейна структура (масив, свързан списък)
- Heap
- Въведение (клип)
- Наивни имплементации (клип)
- Двоични дървета (клип)
- Tree Height Remark (клип)
- Основни операции (клип)
- Завършени двоични дървета (клип)
- Псевдокод (клип)
- Heap Sort - jumps to start (клип)
- Heap Sort (клип)
- Създаване на heap (клип)
- MIT: Heaps and Heap Sort (клип)
- CS 61B Lecture 24: Priority Queues (клип)
- Linear Time BuildHeap (max-heap)
- [Review] Heap (playlist) in 13 minutes (video)
- Имплементирайте max-heap:
- insert
- sift_up - нужно е за insert
- get_max - връща най-голямата стойност без да я премахва
- get_size() - връща броя на елементите
- is_empty() - връща true ако heap-a не съдържа елементи
- extract_max - връща най-големия елемент и го премахва
- sift_down - нужно е за extract_max
- remove(x) - премахва елемента на индекс x
- heapify - създава heap от масив от елементи, нужно е за heap_sort
- heap_sort() - превръща несортиран масив в сортиран такъв, ползвайки max heap или min heap
-
Бележки:
- Имплементирайте алгоритми за сортиране и знайте сложността в средния/ най-добрия/ най-лошия случай:
- без bubble sort - ужасен алгоритъм е - O(n^2), освен когато n <= 16
- Стабилност при сортиращите алгоритми ("Стабилен ли е Quicksort?")
- Кои алгоритми могат да се ползват чрез свързани списъци? Кои чрез масиви? Кои чрез двете?
- Не бих препоръчал да сортирате свързан списък, но би станало с merge sort.
- Merge Sort за свързани списъци
- Имплементирайте алгоритми за сортиране и знайте сложността в средния/ най-добрия/ най-лошия случай:
-
За heapsort, вижте Heap структурата от данни по-горе. Heapsort е чудесен, но не е стабилен
-
UC Berkeley:
-
Код за Merge sort:
-
Код за Quick sort:
-
Имплементирайте:
- Mergesort: O(n log n) сложност в средния/ най-лошия случай
- Quicksort O(n log n) сложност в средния случай
- Selection sort и insertion sort са със сложност O(n^2) в средния/ най-лошия случай
- За heapsort, вижте Heap структурата от данни нагоре
-
Не е задължително, но препоръчвам:
Като обобщение, това е визуализация на 15 алгоритъма за сортиране. Ако ви трябват повече детайли на тази тема вижте секцията "Сортиране" вДопълнителни детайли по някои теми
Графите могат да се ползват за онагледяване на много проблеми в компютърните науки, така че тази секция е дълга, също както тази за дърветата и сортирането..
-
Бележки:
- Има 4 основни начина една графа да бъде представена в паметта:
- обекти и пойнтъри
- матрици на съседство
- списъци на съседство
- мап на съседство
- Запознайте се с всяка от начините за представяне и плюсовете, и минусите, които предоставят
- BFS и DFS - знайте изчислителната им сложност, компромисите, които носят и как да ги имплементирате в истински код
- Когато Ви зададат въпрос, първо потърсете решение с граф и преминете нататък ако няма такова
- Има 4 основни начина една графа да бъде представена в паметта:
-
MIT(клипове):
-
Skiena Lectures - чудесно въведение:
- CSE373 2012 - Лекция 11 - Граф като структура от данни (клип)
- CSE373 2012 - Лекция 12 - Обхождане по ширина (клип)
- CSE373 2012 - Лекция 13 - Алгоритми за графи (клип)
- CSE373 2012 - Лекция 14 - Алгоритми за графи (продължение) (клип)
- CSE373 2012 - Лекция 15 - Алгоритми за графи (продължение 2) (клип)
- CSE373 2012 - Лекция 16 - Алгоритми за графи (продължение 3) (клип)
-
Графи (преговор и повече):
- 6.006 Задача за най-кратък път от един източник (клип)
- 6.006 Дейкстра (клип)
- 6.006 Белман-Форд (клип)
- 6.006 Как да забързаме Дейкстра (клип)
- Aduni: Алгоритми за графи I - Топологично сортиране, Минимално обхващащи дървета, Алгоритъм на Прим - Лекция 6 (клип)
- Aduni: Алгоритми за графи II - DFS, BFS, Алгоритъм на Крускал, Union Find структура от данни - Лекция 7 (клип)
- Aduni: Алгоритми за графи III: Най-кратък път - Лекция 8 (клип)
- Aduni: Алгоритми за графи IV: Въведение в геометричните алгоритми - Лекция 9 (клип)
-
CS 61B 2014 (от 58:09) (клип) - CS 61B 2014: Претеглени графи (клип)
- Алчни алгоритми: Минимално обхващащо дърво (клип)
- Алгоритъм за граф на Kosaraju за силно свързани компоненти (клип)
- [Review] Shortest Path Algorithms (playlist) in 16 minutes (video)
- [Review] Minimum Spanning Trees (playlist) in 4 minutes (video)
-
Пълен курс в Coursera:
-
Аз ще имплементирам:
- DFS със списък на съседство (рекурсивно)
- DFS със списък на съседство (итеративно със стек)
- DFS с матрица на съседство (рекурсивно)
- DFS с матрица на съседство (итеративно със стек)
- BFS със списък на съседство
- BFS с матрица на съседство
- най-кратък път от един източник (Дейкстра)
- минимално обхващащо дърво
- Алгоритми основани върху DFS (вижте клиповете на Aduni по-горе):
- проверка за цикъл (нужно за топологичното сортиране, защото ще проверяваме за цикъла преди стартиране)
- топологично сортиране
- преброяване на свързаните компоненти в графа
- изреждане на силно свързаните компоненти
- проверка за двустранна графа
-
- Лекции от Stanford за рекурсия и backtracking:
- Кога е подходящо да се използва?
- Как опашковата рекурсия е по-добра отколкото без?
-
- Най-вероятно няма да срещнете задачи с динамично програмиране в интервютата си, но си струва да можете да разпознавате задачи, които са годни за решаване с динамично програмиране.
- Тази тема може да е доста сложна защото всяка задача, която може да се решава с ДП трябва да бъде дефинирана чрез рекурсивна връзка, а понякога може да е сложно да се измисли такава.
- Препоръчвам да разгледате много примери за задачи с ДП докато имате стабилно разбиране на структурата им.
- Клипове:
- клиповете от Skiena могат да бъдат сложни за проследяване, тъй като той понякога ползва дъската, която е прекалено малка, за да се види
- Skiena: CSE373 2012 - Лекция 19 - Въведение в динамичното програмиране (клип)
- Skiena: CSE373 2012 - Лекция 20 - Edit Distance (клип)
- Skiena: CSE373 2012 - Лекция 21 - Примери за динамично програмиране (клип)
- Skiena: CSE373 2012 - Лекция 22 - Приложение на динамичното програмиране (клип)
- Simonson: Динамично програмиране 0 (starts at 59:18) (клип)
- Simonson: Динамично програмиране I - Лекция 11 (клип)
- Simonson: Динамично програмиране II - Лекия 12 (клип)
- Списък с единични задачи за динамично програмиране (кратки са): Динамично програмиране (клип)
- Бележки от лекции в Yale:
- Coursera:
- The RNA secondary structure problem (клип)
- Алгоритъм за динамично програмиране (клип)
- Илюстриране на алгоритъма за ДП (клип)
- Време за изпълнение на алгоритъма за ДП (клип)
- ДП срещу рекурсивна имплементация (клип)
- Глобално подравняване на последователности по двойки (клип)
- Локално подравняване на последователности по двойки (клип)
-
- Бърз преговор върху UML (клип)
- Научете тези схеми:
- strategy
- singleton
- adapter
- prototype
- decorator
- visitor
- factory, abstract factory
- facade
- observer
- proxy
- delegate
- command
- state
- memento
- iterator
- composite
- flyweight
- Глава Част 1) - Patterns (клип)
- Глава 6 (Част 2) - Abstraction-Occurrence, General Hierarchy, Player-Role, Singleton, Observer, Delegation (клип)
- Глава 6 (Част 3) - Adapter, Facade, Immutable, Read-Only Interface, Proxy (клип)
- Поредица от клипове (27 клипа)
- Head First Design Patterns
- Знам, че каноничната книга е "Design Patterns: Elements of Reusable Object-Oriented Software", но Head First е чудесна за начинаещи в ОО.
- Удобен справочник: 101 Design Patterns & Tips for Developers
- Design patterns за хора
-
- Математични умения: как да намираме пермутации, вариации и комбинации (клип)
- Make School: Вероятности (клип)
- Make School: Още вероятности и Марковски вериги (клип)
- Khan Academy:
- Оформление на курса:
- Само клиповете - 41 (всичките са прости и къси):
-
- Знайте за най-известните задачи за NP-завършеност като пътуващия търговец и бъдете сигурни, че можете да ги разпознавате, когато интервюиращия ви ги даде прикрити
- Знайте какво означава NP-завършен.
- Изчислителна сложност (клип)
- Simonson:
- Skiena:
- Сложност: P, NP, NP-завършеност, редукции (клип)
- Сложност: Алгоритми за приближаване (клип)
- Сложност: Алгоритми с фиксирани параметри (клип)
- Peter Norvig обсъжда почти оптимални решения на задачата за пътуващия търговец:
- Страници 1048 - 1140 в CLRS ако я имате.
-
- Computer Science 162 - Операционни системи (25 клипа):
- за процеси и нишки вижте клипове 1-11
- Операционни системи и системно програмиране (клип)
- Каква е разликата между процес и нишка?
- Покрива:
- Процеси, нишки, проблеми с concurrency
- Разликата между процеси и нишки
- Процеси
- Нишки
- Locks
- Мутекси
- Семафори
- Монитори
- Как работят?
- Deadlock
- Livelock
- CPU дейност, interrupts, смяна на контекста
- Модерни конструкции за concurrency с многоядрени процесори
- Пейджинг, сегментация и виртуална памет (клип)
- Interrupts (клип)
- Ресурси, от които се нуждаят процесите (памет: код, статично пространство, стек, heap, и file descriptors, i/o)
- Ресурси, от които се нуждаят нишките (споделя същите като по-горе (без стек) с други нишки в същия процес, но всяка има свой pc, стек брояч, регистри и стек)
- Forking is really copy on write (read-only) until the new process writes to memory, then it does a full copy.
- Смяна на контекста
- Как смяната на контекста се инициира от операционната система и хардуера?
- Процеси, нишки, проблеми с concurrency
- Нишки в C++ (серия - 10 клипа)
- CS 377 Spring '14: Операционни системи от University of Massachusetts
- concurrency в Python (клипове):
- Computer Science 162 - Операционни системи (25 клипа):
-
- Да се покрие:
- как работи unit тестването
- какво са mock обекти
- какво е integration тестването
- какво е dependency injection
- Agile Software Testing с James Bach (клип)
- Лекция от James Bach върху софтуерното тестване (клип)
- Steve Freeman - Test-Driven Development (that’s not what we meant) (клип)
- Dependency injection:
- Как да пишем тестове
- Да се покрие:
-
- Sedgewick - Суфиксни масиви (клип)
- Sedgewick - Substring Search (клипове)
- Търсене на на шаблон в текст (клип)
Ако ви трябват допълнителни детайли по тази тема вижте секцията "String Matching" в Допълнителни детайли по някои теми.
-
- Обърнете внимание, че има различни видове tries. Някои имат prefixes, а други нямат, също така някои ползват низове вместо битове за да следят пътеката
- Разгледах кода, но няма да го имплементирам
- Sedgewick - Tries (3 клипа)
- Бележки върху структурите от данни и техники за програмиране
- Малък курс с клипове:
- Trie: неглежираната структура от данни
- TopCoder - използване на Tries
- Stanford лекция (приложение в истинския живот) (клип)
- MIT, Структури от данни за напреднали, Низове (може да има доста неяснота към половината на клипа) (клип)
-
- Голям и малък Endian
- Голям Endian срещу Малък Endian (клип)
- Голям и малък Endian отвътре-навън (клип)
- Много техничен разговор за kernel разработчици. Не се тревожете ако не схващате повечето неща.
- Първата половина е достатъчна.
-
- очаквайте въпроси по тази тема ако имте опит с мрежи или искате да бъдете reliability engineer/ operations engineer
- Иначе това са неща, които е добре да се знаят
- Khan Academy
- UDP и TCP: Сравнение на протоколи за пренос на информация (клип)
- TCP/IP и OSI моделът обяснени! (клип)
- Пренос на пакети през интернет. Ръководство за мрежи & TCP/IP. (клип)
- HTTP (клип)
- SSL и HTTPS (клип)
- SSL/TLS (клип)
- HTTP 2.0 (клип)
- Видеосерия (21 клипа) (клип)
- Subnetting Demystified - Part 5 CIDR Notation (клип)
- Sockets:
Тази секция съдържа по-кратки клипове за най-важните понятия, които можете да изгледате сравнително бързо. Полезни са ако искате да си припомните нещо от време на време.
- Серия от 2-3 минутни кратки клипове по различни теми (23 клипа)
- Серия от 2-5 минутни кратки клипове по различни теми - Michael Sambol (40 клипа):
- Sedgewick Videos - Алгоритми I
- Sedgewick Videos - Алгоритми II
- See Resume prep information in the books: "Cracking The Coding Interview" and "Programming Interviews Exposed"
- Не знам колко важно е това (можете сами да си направите проучване), но ето една статия за това как да направим резюмето си ATS Compliant:
- "This Is What A GOOD Resume Should Look Like" от Gayle McDowell (авторът на Cracking the Coding Interview),
- Бележка от автора: "Това се отнася към резюмета за САЩ. Към CV-тата за Индия и други държави има различни изисквания, но много от точките ще са същите."
- Как да минем през интервюто за инженер през 2021
- Демистифициране на Tech рекрутинга
- Как да намерим работа в Големите 4:
- Cracking The Coding Interview Set 1:
- Cracking the Facebook Coding Interview:
- Курсове за подготовка:
- Software Engineer Interview Unleashed (платен курс):
- Научете как да се подготвяте за интервюта за софтуерен разработчик от бивш интервюиращ в Google
- Python for Data Structures, Algorithms, and Interviews (платен курс):
- Курс, ориентиран към Python, който покрива структури от данни, алгоритми, mock интервюта и много повече.
- Intro to Data Structures and Algorithms using Python (безплатен курс от Udacity):
- Безплатен курс върху структури от данни и алгоритми, ориентиран към Python.
- Data Structures and Algorithms Nanodegree! (платен Nanodegree от Udacity):
- Get hands-on practice with over 100 data structures and algorithm exercises and guidance from a dedicated mentor to help prepare you for interviews and on-the-job scenarios.
- Grokking the Behavioral Interview (безплатен курс от Educative):
- Много често, не техническата Ви компетентност, а личностното интервю Ви спират да започнете мечтаната си работа.
- Software Engineer Interview Unleashed (платен курс):
Mock интервюта:
- Gainlo.co: Mock интервюта от големи компании - Използвах това и ми помогна да се успокоя за телефонното, screen и on-site интервютата
- Pramp: Mock интервюта от/с връсници - модел за подготовка за интервю с връсници
- interviewing.io: Mock интервюта за подготовка със senior инженери - анонимни интервюта за дизайн на алгоритми/системи със senior инженери от FAANG компаниите
Помислете за около 20 въпроса за интервю, които може да ви се паднат и редовете надолу. Имайте поне един отговор за всеки от тях. Имайте история, а не само данни за нещо, което сте постигнали.
-
Защо искате тази работа?
-
Дайте пример за труден проблем, който сте разрешили.
-
Кое е най-голямото предизвикателство, с което сте се сблъсквали?
-
Best/worst designs seen?
-
Дайте идея за подобрение на съществуващ продукт.
-
Как работите най ефективно- самостоятелно или като част от екип?
-
Кои от уменията Ви ще са важни активи в позицията и защо?
-
Какво най-много Ви хареса на [работа x / проейт y]?
-
Какво беше най-голямото предизвикателство, с което се сблъскахте на [работа x / проект y]?
-
Кой е най-трудния bug, с който сте се сблъсквали на [работа x / проект y]?
-
Какво научихте на [работа x / проект y]?
-
Какво можехте да направите по-добре на [работа x / проект y]?
-
Ако Ви се струва трудно да давате отговор на подобни въпроси, ето някои идеи:
Ето някои от моите (може вече да знам отговорът им когато ги задавам, но искам да чуя тяхното мнение и да видя перспективата им):
- Колко е голям екипът Ви?
- What does your dev cycle look like? Ползвате ли waterfall/sprints/agile методологии?
- Често ли се случва да гоните срокове? Или има гъвкавост?
- Как вземате решения във вашия екип?
- Колко срещи имате на седмица?
- Как работната среда Ви помага да се концентрирате, според Вас?
- Върху какво работите в момента?
- Какво Ви харесва за него?
- Как е работният Ви живот?
- Как е балансът Ви работа/свободно време?
Поздравления!
Продължавайте да учите.
Никога не сте свършили наистина.
*****************************************************************************************************
*****************************************************************************************************
Всичко оттук надолу е по желание. НЕ е нужно за entry-level интервю, но ако научите тези неща ще сте изложени пред повече концепции от компютърните науки и ще сте добре подготвени за всяка работа за софтуерно инженерство. Ще сте много по-добър софтуерен инженер.
*****************************************************************************************************
*****************************************************************************************************
Книгите тук ще ви позволят да се гмурнете в теми, които са интересни за вас.
- The Unix Programming Environment
- An oldie but a goodie
- The Linux Command Line: A Complete Introduction
- A modern option
- TCP/IP Illustrated Series
- Head First Design Patterns
- A gentle introduction to design patterns
- Design Patterns: Elements of Reusable Object-Oriented Software
- AKA the "Gang Of Four" book, or GOF
- The canonical design patterns book
- Algorithm Design Manual (Skiena)
- As a review and problem recognition
- The algorithm catalog portion is well beyond the scope of difficulty you'll get in an interview
- This book has 2 parts:
- Class textbook on data structures and algorithms
- Pros:
- Is a good review as any algorithms textbook would be
- Nice stories from his experiences solving problems in industry and academia
- Code examples in C
- Cons:
- Can be as dense or impenetrable as CLRS, and in some cases, CLRS may be a better alternative for some subjects
- Chapters 7, 8, 9 can be painful to try to follow, as some items are not explained well or require more brain than I have
- Don't get me wrong: I like Skiena, his teaching style, and mannerisms, but I may not be Stony Brook material
- Pros:
- Algorithm catalog:
- This is the real reason you buy this book.
- This book is better as an algorithm reference, and not something you read cover to cover.
- Class textbook on data structures and algorithms
- Can rent it on Kindle
- Answers:
- Errata
- Write Great Code: Volume 1: Understanding the Machine
- The book was published in 2004, and is somewhat outdated, but it's a terrific resource for understanding a computer in brief
- The author invented HLA, so take mentions and examples in HLA with a grain of salt. Not widely used, but decent examples of what assembly looks like
- These chapters are worth the read to give you a nice foundation:
- Chapter 2 - Numeric Representation
- Chapter 3 - Binary Arithmetic and Bit Operations
- Chapter 4 - Floating-Point Representation
- Chapter 5 - Character Representation
- Chapter 6 - Memory Organization and Access
- Chapter 7 - Composite Data Types and Memory Objects
- Chapter 9 - CPU Architecture
- Chapter 10 - Instruction Set Architecture
- Chapter 11 - Memory Architecture and Organization
- Introduction to Algorithms
- Important: Reading this book will only have limited value. This book is a great review of algorithms and data structures, but won't teach you how to write good code. You have to be able to code a decent solution efficiently
- AKA CLR, sometimes CLRS, because Stein was late to the game
- Computer Architecture, Sixth Edition: A Quantitative Approach
- For a richer, more up-to-date (2017), but longer treatment
You can expect system design questions if you have 4+ years of experience.
- Scalability and System Design are very large topics with many topics and resources, since there is a lot to consider when designing a software/hardware system that can scale. Expect to spend quite a bit of time on this
- Considerations:
- Scalability
- Distill large data sets to single values
- Transform one data set to another
- Handling obscenely large amounts of data
- System design
- features sets
- interfaces
- class hierarchies
- designing a system under certain constraints
- simplicity and robustness
- tradeoffs
- performance analysis and optimization
- Scalability
- START HERE: The System Design Primer
- System Design from HiredInTech
- How Do I Prepare To Answer Design Questions In A Technical Interview?
- 8 Things You Need to Know Before a System Design Interview
- Database Normalization - 1NF, 2NF, 3NF and 4NF (video)
- System Design Interview - There are a lot of resources in this one. Look through the articles and examples. I put some of them below
- How to ace a systems design interview
- Numbers Everyone Should Know
- How long does it take to make a context switch?
- Transactions Across Datacenters (video)
- A plain English introduction to CAP Theorem
- MIT 6.824: Distributed Systems, Spring 2020 (20 videos)
- Consensus Algorithms:
- Consistent Hashing
- NoSQL Patterns
- Scalability:
- You don't need all of these. Just pick a few that interest you.
- Great overview (video)
- Short series:
- Scalable Web Architecture and Distributed Systems
- Fallacies of Distributed Computing Explained
- Jeff Dean - Building Software Systems At Google and Lessons Learned (video)
- Introduction to Architecting Systems for Scale
- Scaling mobile games to a global audience using App Engine and Cloud Datastore (video)
- How Google Does Planet-Scale Engineering for Planet-Scale Infra (video)
- The Importance of Algorithms
- Sharding
- Engineering for the Long Game - Astrid Atkinson Keynote(video)
- 7 Years Of YouTube Scalability Lessons In 30 Minutes
- How PayPal Scaled To Billions Of Transactions Daily Using Just 8VMs
- How to Remove Duplicates in Large Datasets
- A look inside Etsy's scale and engineering culture with Jon Cowie (video)
- What Led Amazon to its Own Microservices Architecture
- To Compress Or Not To Compress, That Was Uber's Question
- When Should Approximate Query Processing Be Used?
- Google's Transition From Single Datacenter, To Failover, To A Native Multihomed Architecture
- The Image Optimization Technology That Serves Millions Of Requests Per Day
- A Patreon Architecture Short
- Tinder: How Does One Of The Largest Recommendation Engines Decide Who You'll See Next?
- Design Of A Modern Cache
- Live Video Streaming At Facebook Scale
- A Beginner's Guide To Scaling To 11 Million+ Users On Amazon's AWS
- A 360 Degree View Of The Entire Netflix Stack
- Latency Is Everywhere And It Costs You Sales - How To Crush It
- What Powers Instagram: Hundreds of Instances, Dozens of Technologies
- Salesforce Architecture - How They Handle 1.3 Billion Transactions A Day
- ESPN's Architecture At Scale - Operating At 100,000 Duh Nuh Nuhs Per Second
- See "Messaging, Serialization, and Queueing Systems" way below for info on some of the technologies that can glue services together
- Twitter:
- For even more, see "Mining Massive Datasets" video series in the Video Series section
- Practicing the system design process: Here are some ideas to try working through on paper, each with some documentation on how it was handled in the real world:
- review: The System Design Primer
- System Design from HiredInTech
- cheat sheet
- flow:
- Understand the problem and scope:
- Define the use cases, with interviewer's help
- Suggest additional features
- Remove items that interviewer deems out of scope
- Assume high availability is required, add as a use case
- Think about constraints:
- Ask how many requests per month
- Ask how many requests per second (they may volunteer it or make you do the math)
- Estimate reads vs. writes percentage
- Keep 80/20 rule in mind when estimating
- How much data written per second
- Total storage required over 5 years
- How much data read per second
- Abstract design:
- Layers (service, data, caching)
- Infrastructure: load balancing, messaging
- Rough overview of any key algorithm that drives the service
- Consider bottlenecks and determine solutions
- Understand the problem and scope:
- Exercises:
Добавих тези теми, за да Ви помогна да бъдете по-добри софтуерни инженери и да сте наясно с определени технологии и алгоритми, което ще разшири "инструментите", с които можете да работите
-
- Запознайте се с някой unix-базиран кодов редактор
- vi(m):
- emacs:
- Emacs-Наръчник за начинаещи (видео от David Wilson)
- Emacs-Наръчник за начинаещи (записки на David Wilson)
-
- Khan Academy
- Повече за Марковските процеси:
- Вижте повече в серията Information and Entropy MIT 6.050J надолу
-
- Въведение
- Паритет
- Код на Хаминг:
- Проверка за грешко
-
- Вижте също клиповете надолу
- Първо изгледайте клиповете за information theory
- Information Theory, Клод Шанън, Ентропия, Redundancy, Компресия на данни & Битове (клип)
-
- Вижте също клиповете надолу
- Първо изгледайте клиповете за information theory
- Khan Academy
- Криптография: Функции за хеширане
- Криптография: Криптиране
-
- Първо изгледайте клиповете за information theory
- Computerphile (клипове):
- Compressor Head клипове
- (по желание) Google Developers Live: GZIP не е достатъчен!
-
- Given a Bloom filter with m bits and k hashing functions, both insertion and membership testing are O(k)
- Bloom Filters (клип)
- Bloom Filters | "Копаене" на големи dataset-ове | Stanford University (клип)
- Ръководство
- Как да напишем Bloom Filter приложение
-
- Използва се за преценяването на сходността на документи
- Обратното на MD5 или SHA, които се ползват за преценяване дали два документа/низа са напълно еднакви
- Simhashing (hopefully) made simple
-
-
Познавайте поне един вид двоични балансирани дървета(и как се имплементират):
-
"Among balanced search trees, AVL and 2/3 trees are now passé, and red-black trees seem to be more popular. A particularly interesting self-organizing data structure is the splay tree, which uses rotations to move any accessed key to the root." - Skiena
-
Of these, I chose to implement a splay tree. From what I've read, you won't implement a balanced search tree in your interview. But I wanted exposure to coding one up and let's face it, splay trees are the bee's knees. I did read a lot of red-black tree code
- Splay tree: insert, search, delete functions If you end up implementing red/black tree try just these:
- Search and insertion functions, skipping delete
-
I want to learn more about B-Tree since it's used so widely with very large data sets
-
AVL trees
- In practice: From what I can tell, these aren't used much in practice, but I could see where they would be: The AVL tree is another structure supporting O(log n) search, insertion, and removal. It is more rigidly balanced than red–black trees, leading to slower insertion and removal but faster retrieval. This makes it attractive for data structures that may be built once and loaded without reconstruction, such as language dictionaries (or program dictionaries, such as the opcodes of an assembler or interpreter)
- MIT AVL Trees / AVL Sort (video)
- AVL Trees (video)
- AVL Tree Implementation (video)
- Split And Merge
-
Splay trees
- In practice: Splay trees are typically used in the implementation of caches, memory allocators, routers, garbage collectors, data compression, ropes (replacement of string used for long text strings), in Windows NT (in the virtual memory, networking and file system code) etc
- CS 61B: Splay Trees (video)
- MIT Lecture: Splay Trees:
- Gets very mathy, but watch the last 10 minutes for sure.
- Video
-
Red/black trees
- These are a translation of a 2-3 tree (see below).
- In practice: Red–black trees offer worst-case guarantees for insertion time, deletion time, and search time. Not only does this make them valuable in time-sensitive applications such as real-time applications, but it makes them valuable building blocks in other data structures which provide worst-case guarantees; for example, many data structures used in computational geometry can be based on red–black trees, and the Completely Fair Scheduler used in current Linux kernels uses red–black trees. In the version 8 of Java, the Collection HashMap has been modified such that instead of using a LinkedList to store identical elements with poor hashcodes, a Red-Black tree is used
- Aduni - Algorithms - Lecture 4 (link jumps to starting point) (video)
- Aduni - Algorithms - Lecture 5 (video)
- Red-Black Tree
- An Introduction To Binary Search And Red Black Tree
- [Review] Red-Black Trees (playlist) in 30 minutes (video)
-
2-3 search trees
- In practice: 2-3 trees have faster inserts at the expense of slower searches (since height is more compared to AVL trees).
- You would use 2-3 tree very rarely because its implementation involves different types of nodes. Instead, people use Red Black trees.
- 23-Tree Intuition and Definition (video)
- Binary View of 23-Tree
- 2-3 Trees (student recitation) (video)
-
2-3-4 Trees (aka 2-4 trees)
- In practice: For every 2-4 tree, there are corresponding red–black trees with data elements in the same order. The insertion and deletion operations on 2-4 trees are also equivalent to color-flipping and rotations in red–black trees. This makes 2-4 trees an important tool for understanding the logic behind red–black trees, and this is why many introductory algorithm texts introduce 2-4 trees just before red–black trees, even though 2-4 trees are not often used in practice.
- CS 61B Lecture 26: Balanced Search Trees (video)
- Bottom Up 234-Trees (video)
- Top Down 234-Trees (video)
-
N-ary (K-ary, M-ary) trees
- note: the N or K is the branching factor (max branches)
- binary trees are a 2-ary tree, with branching factor = 2
- 2-3 trees are 3-ary
- K-Ary Tree
-
B-Trees
- Fun fact: it's a mystery, but the B could stand for Boeing, Balanced, or Bayer (co-inventor).
- In Practice: B-Trees are widely used in databases. Most modern filesystems use B-trees (or Variants). In addition to its use in databases, the B-tree is also used in filesystems to allow quick random access to an arbitrary block in a particular file. The basic problem is turning the file block i address into a disk block (or perhaps to a cylinder-head-sector) address
- B-Tree
- B-Tree Datastructure
- Introduction to B-Trees (video)
- B-Tree Definition and Insertion (video)
- B-Tree Deletion (video)
- MIT 6.851 - Memory Hierarchy Models (video) - covers cache-oblivious B-Trees, very interesting data structures - the first 37 minutes are very technical, may be skipped (B is block size, cache line size)
- [Review] B-Trees (playlist) in 26 minutes (video)
-
-
- Подходящи за намиране на брой точки в квадратен или по-висш по размерност обект
- Подходящи за к-ти близки съседи
- kNN K-d tree algorithm (video)
-
- "These are somewhat of a cult data structure" - Skiena
- Randomization: Skip Lists (video)
- For animations and a little more detail
-
- Комбинация от двоично дърво за търсене и heap
- Treap
- Структури от данни: Treaps обяснени (клип)
- Applications in set operations
-
- Защо ML?
- Google's Cloud Machine learning tools (video)
- Google Developers' Machine Learning Recipes (Scikit Learn & Tensorflow) (video)
- Tensorflow (video)
- Tensorflow Tutorials
- Practical Guide to implementing Neural Networks in Python (using Theano)
- Courses:
- Great starter course: Machine Learning - videos only - see videos 12-18 for a review of linear algebra (14 and 15 are duplicates)
- Neural Networks for Machine Learning
- Google's Deep Learning Nanodegree
- Google/Kaggle Machine Learning Engineer Nanodegree
- Self-Driving Car Engineer Nanodegree
- Resources:
Добавих тези, за да подкрепя някои от темите и материалите посочени по горе, но не исках да ги добавям там, защото са прекалено много. Лесно е да научите прекалено много по някоя тема. Искате да Ви наемат този век, нали?
-
SOLID
- Bob Martin SOLID Principles of Object Oriented and Agile Design (video)
- S - Single Responsibility Principle | Single responsibility to each Object
- O - Open/Closed Principle | On production level Objects are ready for extension but not for modification
- L - Liskov Substitution Principle | Base Class and Derived class follow ‘IS A’ Principle
- I - Interface segregation principle | clients should not be forced to implement interfaces they don't use
- D -Dependency Inversion principle | Reduce the dependency In composition of objects.
-
Union-Find
-
Още динамично програмиране (клипове)
- 6.006: Динамично програмиране I: Fibonacci, Shortest Paths
- 6.006: Динамично програмиране II: Text Justification, Blackjack
- 6.006: ДП III: Parenthesization, Edit Distance, Knapsack
- 6.006: ДП IV: Guitar Fingering, Tetris, Super Mario Bros.
- 6.046: Динамично програмиране & ДП за напреднали
- 6.046: Динамично програмиране: All-Pairs Shortest Paths
- 6.046: Динамично програмиране (студентско упражнение)
-
Работа с Графи за напреднали (видеа)
-
MIT Вероятности (съдържа доста математика, минавайте бавно през този материал) (клипове):
-
Съвпадение на низове
- Алгоритъм на Рабин-Карп (видеа):
- Алгоритъм на Кнут-Морис-Прaт (KMP):
- Алгоритъм на Бойер-Мур
- Coursera: Algorithms on Strings
- Започва супер, но след KMP започва да става излишно сложен
- Добро обяснение на префиксни дървета
- Може да го пропуснете
-
Сортиране
- Stanford лекции за сортиране:
- Shai Simonson, Aduni.org:
- Steven Skiena лекции за сортиране:
Настанете се удобно и се наслаждавайте.
-
Списък с различни Dynamic Programming задачи (за всички накратко)
-
Excellent - MIT Calculus Revisited: Single Variable Calculus
-
CSE373 - Анализ на алгоритми (25 клипа)
-
UC Berkeley CS 152: Computer Architecture and Engineering (20 видеа) -
MIT 6.042J: Mathematics for Computer Science, Fall 2010 (25 видеа)
- Папка с онлайн курсове по компютърни науки
- Папка с курсове по компютърни науки (много от които с онлайн лекции)
- Love classic papers?
- 1978: Communicating Sequential Processes
- 2003: The Google File System
- сменено от Colossus през 2012
- 2004: MapReduce: Simplified Data Processing on Large Clusters
- сменено от Cloud Dataflow?
- 2006: Bigtable: A Distributed Storage System for Structured Data
- 2006: The Chubby Lock Service for Loosely-Coupled Distributed Systems
- 2007: Dynamo: Amazon’s Highly Available Key-value Store
- Dynamo е статията която стартира NoSQL революцията.
- 2007: What Every Programmer Should Know About Memory (very long, and the author encourages skipping of some sections)
- 2012: AddressSanitizer: A Fast Address Sanity Checker:
- 2013: Spanner: Google’s Globally-Distributed Database:
- 2014: Machine Learning: The High-Interest Credit Card of Technical Debt
- 2015: Continuous Pipelines at Google
- 2015: High-Availability at Massive Scale: Building Google’s Data Infrastructure for Ads
- 2015: TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems
- 2015: How Developers Search for Code: A Case Study
- Още материал: 1,000 статии