«Soft Errors» - незрозумілі проблеми з комп'ютером

Прочитав в wired і вирішив перевести. Стаття, звичайно, на рівні комсомольської правди, але може бути цікавою

Близько року тому у Стівена Джакіса (Stephen Jakisa) виникли серйозні проблеми з його комп'ютером. Вони почалися, коли він встановив Battlefield 3 - шутер від першої особи, дія в якому розгортається в недалекому майбутньому. Незабаром проблеми були не тільки в грі, але і його браузер "вилітав" кожні 30 хвилин або близько того. У підсумку він навіть не міг встановити ніяких програм на свій ПК.

Дійшло до того, що Стівен - програміст за фахом, і цілком розбирається в техніці людина, вирішив що "зловив" вірус або, можливо, встановив якийсь ПО з серйозними багами. З проблемою він вирішив звернутися до свого друга Іоанну Стефанович (Ioan Stevanovici), який як раз писав дисертацію по надійності комп'ютерів.

Після недовгої діагностики, Стівен і Іоанн виявили проблему - поганий чіп пам'яті в комп'ютері Джакіса. Оскільки комп'ютер прекрасно працював близько шести місяців до виникнення проблеми, Стівен не підозрював неполадок в устаткуванні, поки його товариш не вмовив запустити спеціальний тест для аналізу пам'яті. Для Стівена це було досить незвично. Як він сам сказав: "Якби це сталося з кимось на вулиці, з ким-то, хто нічого не знає про комп'ютери, він, мабуть, був би в глухому куті".

Після того, як Джакіса витягнув проблемний модуль пам'яті, його комп'ютер працює нормально.

Коли комп'ютери ламаються, як правило, вважають, що проблеми з програмним забезпеченням. Однак в останні кілька років вчені-комп'ютерники стали звертати все більш пильну увагу на апаратні збої і приходити висновку до того, що проблеми з-за них відбуваються набагато частіше, ніж багато хто думає.

Soft Errors

Синій екран смерті в Windows 8

Виробники мікросхем проводять серйозну роботу з тестування своїх чіпів, перш ніж випустити їх в продаж, але вони не люблять говорити про той факт, що досить складно забезпечити працездатний стан мікросхем протягом довгого часу. З кінця 70-х років минулого століття виробникам чіпів відомо, що ряд апаратних проблем можуть бути викликані зміною стану бітів всередині мікропроцесорів. У міру зменшення розмірів транзисторів, поведінку заряджених частинок в них стає все менш передбачуваним. Виробники називають такі помилки "soft error", хоча вони і не мають відношення до програмного забезпечення.

Однак, ці soft errors - складають лише частину проблеми: протягом останніх п'яти років дослідники, вивчаючи складні і великі комп'ютерні системи, прийшли до висновку, що в багатьох випадках використовується нами комп'ютерна техніка є просто зламаною. Висока температура або виробничі дефекти можуть привести до того, що електронні компоненти виходять з ладу через певний час, дозволяючи електронам вільно перетікати між транзисторами або каналами мікросхеми, призначеної для передачі даних.

Вчені, які беруть участь в розробці комп'ютерних чіпів наступних поколінь проявляють серйозне занепокоєння з приводу таких помилок і один з головних аспектів цієї проблеми - енергія. У міру виробництва наступних поколінь комп'ютерів, вони набувають все більшу кількість мікросхем і все більш дрібні компоненти. І, в рамках цих крихітних транзисторів, все більше енергії необхідно для того, щоб утримувати біти всередині них.

Проблема пов'язана з фундаментальною фізикою. У міру того, як виробники мікросхем пересилають електрони по всі меншим і меншим каналам, електрони просто вибиваються з них. Чим менше провідні канали, тим більше електронів можуть "витекти" і тим більшу кількість енергії потрібно для нормального функціонування комп'ютерів. Ця проблема є настільки складною, що компанія Intel працює спільно з Міністерством енергетики США та іншими урядовими установами для її вирішення. В майбутньому Intel планує використовувати 5-нм технологічний процес для виготовлення мікросхем, які будуть більш ніж в 1000 разів перевершувати по продуктивності ті, які очікуються до кінця цього десятиліття. Однак, схоже, що подібні чіпи зажадають також і неймовірної кількості енергії.

"Ми знаємо, як зробити такі чіпи, якщо не турбуватися про споживання енергії", - говорить Марк Сігер (Mark Seager), головний директор за технологіями високопродуктивних обчислювальних екосистем в Intel, - "Але якщо Ви попросите нас відповісти і на це питання - це вище наших технічних можливостей ".

Для звичайних користувачів комп'ютерів, таких як Стівен Джакіса, світ подібних помилок - невідома область. Виробники чіпів не люблять говорити про те, як часто їх продукція дає збої, вважаючи за краще тримати цю інформацію в таємниці.