Category: компьютеры

Category was added automatically. Read all entries about "компьютеры".

(no subject)

Месяц назад очень забавно ремонтировал сервер.

Есть у нас такие дуры - h2200wp, блейд-сервер такой плоский из 4х нод в 2U, очень такой компактный.
Отличная штука.

Две из 4-х нод одного сервера я вводил в строй после ввода первых двух, это значит, туда надо засунуть память, процессор, и прошить там BIOS/BMC/FRU/ME/..., чтобы плата поняла, в каком корпусе она стоит и какими вентиляторами куда и сколько дуть для правильного охлаждения.

Приезжаю в ДЦ, иду внутрь, вынимаю одну нижнюю ноду (две из четырех уже работают). Засовываю процессоры, памяти, ставлю назад. Загружаю EFI, прошиваю BIOS в флешки. Перезагружаю, и... не грузится.
Монитор не зажигает, лампочками мигает что-то непонятное. Что за фигня, начинаю разбираться.

Читаю мануал по восстановлению BIOS-а, расшифровываю лампочки статуса, и так далее. В целом материнская плата хорошая, но как-то у меня всё не клеится. Лампочки то одно показывают, то другое, результата однако нет - экран сервера не зажигается.
Ищу в интернете, сколько вообще стоит нода к этому серверу, не особо нахожу. Intel несколько позже перешел на производство этих штук в качестве конструктора, поэтому мало кто продает отдельно компоненты этого блейда. Единодушие всех прайс-агрегаторов о том, что такой ноды (матери) в продаже просто не бывает, расстраивает.

Хочу переставить процессор и память в свободную ноду, чтобы хоть что-то запустить. Вытаскиваю ноду (одну из верхних), переставляю туда процессор/память, новая нода тоже не включает экран. Начинаю разбираться - что за ерунда вообще творится, беспокойств нарастает.
Вынимаю - вставляю эту ноду, вынимаю-вставляю, ну пока джамперы на recovery прошивки переключаешь туда-сюда.

В один момент нода в сервер вставляться перестала, я вынул и вижу, что, помимо уже неработающих так или иначе двух нод из четырех - благо пока не нужных - назревает совсем уже эпическая фигня: одна из нижних нод, имея на борту 256 гб памяти и оба процессора, при полной нагрузке, выдула вентиляторами охлаждения пластмассовый кожух, который отделяет верние ноды от нижних. И этот кожух мешает верхнему блейду вставиться, т.к. на его месте располагается выплющенный контур охлаждения нижнего работающего блейда.

Стою с горечью втыкаю эту безрадостную картину, начинаю судорожно длинной отверткой или руками пытаться на ходу засунуть его на место, но это естественно невозможно. Мощность системы охлаждения в максимальном режиме у ноды под 60 ватт, и всё оно естественно с дикой силой, учитывая угол, толкает кожух вверх.

В такой мучительной борьбе проходит примерно минута, контур охлаждения не работает - в плоские радиаторы процессоров воздух должен входить под давлением кожуха, которого уже нет. Об сервер уже можно конкретно со многих сторон обжечься. Так длится минуты две, потом сервер издает жалобный писк и отключается.
Это потом я прочел в логе, что сервер отключился по сигналу одного из процессоров "хватит это терпеть":
0104 05/31/13 01:40:37 BMC  07 Processor #80 Proc Config Error 03 [a1 01 03]
0105 05/31/13 01:40:41 BMC  07 Processor #80 ProcErr Asserted 83 [a1 01 03]
..а тогда мне стало уже конкретно совсем не до смеха, ибо на данный момент я практически своими руками запорол три ноды из четырех, общим планируемым объемом в 768 Гб клиентской памяти. :)
Причем одну я уже и так не смог починить в течение нескольких часов из-за непоняток с BIOS-ом (предупреждают, что прошитие неправильного ME может сделать плату не ремонтопригодной бытовым способом), а вторая, возможно, дала коня с перегрева.

Выключаю сервер питанием. Заправляю туда этот долбаный кожух. Кладу сверху гирю, чтобы не сдуло. Засовываю обратно. Включаю.
0106 05/31/13 01:47:01 BMC  09 Power Unit #01 Power Off     6f [00 ff ff]
0107 05/31/13 01:47:01 BMC  09 Power Unit #01 AC Lost 6f [04 ff ff]
0108 05/31/13 01:48:06 BMC  09 Power Unit #01 AC Regained ef [04 ff ff]
0109 05/31/13 01:48:08 BMC  09 Power Unit #01 Power Restored ef [00 ff ff]
Подключаю монитор, посмотреть, что он там себе думает. И что таки вы думаете - и этот сервер монитор теперь тоже не включает.

Три ноды блейда из четырех не заводятся причем одна была в полном продакшене. Одна еще работает. Тут у меня от столь радужного хода технических работ настал уже полный facepalm.

* * *

В целом, ситуация разрешилась достаточно успешно.
Виноват в ней был зависший (!) монитор (!) передвижной консоли дата-центра (!).
Причем монитор лампочкой светил "желто", но вот картинку не показывал. Это от полной безнадеги, почувствовав еще через 20 минут мучений что-то неладное, выяснилось, когда я стал его втыкать в полностью рабочие сервера, а потом и для верности в ноутбук.

После починки монитора (ресетом по питанию, млин, ....) дело стало налаживаться. Сервер со сработавшей термозащитой остался полностью рабочим, процессор запаниковал вовремя.
Сервер с запоротым BIOS-ом шел по recovery, оказывается, правильно, просто при неработающем мониторе это было плохо понятно.
Ну и так далее.

* * *

Единственное, что мне осталось непонятно, это как проводить работы на верхних нодах, если нижние при этом, если находятся на полной рабочей мощности, сдувают с себя кожух охлаждения. Но, наверное, на следующих блейдах этого типа я буду крепить кожух сам чем-нибудь типа скотча, чтобы он не улетал в такой конфигурации.

Такие вот технические работы. Ну я еще провозился там как следует в тот же день и домой уехал в 5 утра, но это уже следующая история.

А блейды эти хороши, да.

(no subject)

Роутер домашний дохнет. Ну почему роутеры домашние - строго расходный материал с периодом полураспада 1 год?
Какую фирму не покупай, дохнет и всё. Первый раз интернет сдох через год работы примерно. Я еще подумал, NetGear, какая хорошая фирма. Второй раз - через пол года. Ладно, бывает. Потом раз в месяц. Это ничего еще.
Последние дни короче хорошо если он успевает проработать сутки. Я теперь думаю, блин, NetGear, такое же говно, как у всех.

Причем самое обидное, там есть 4 проблемы,
- виснет порт,
- виснет NAT,
- виснет DHCP,
- виснет DNS прокси к NAT-у

и вот обычно случаются последние две проблемы. Мне они с моим VPN-ом никак не мешают, но смущают всю остальную домашнюю технику и другие компьютеры. И всё равно приходится перезагружать.
А уж когда порт виснет, да идите вы в пень в общем, пойду завтра покупать очередную дрянь.
Они в принципе и стоят как расходный материал.

(no subject)

Европейский хостинг.
Самая серьезная проблема - какую локаль и вообще ставить на серверах? Windows.
Русскую? На машинах, поддерживающих ядро системы, допустим. Иначе там просто что-нибудь отвалится, да и в конце концов, администрируют русские.
Рабочие машины?
Немецкую? Допустим, но кто его понимает, кроме немцев? Никто. Я и сам с трудом его понимаю. Если очень долго глядеть только.
UK? Ну вот поставил я UK, но скажите мне пожалуйста, они же там не по той стороне дороги ездят кажется, да? Фунты там всякие? И вот я еще теперь про них знаю что у них кнопки "\" на клавиатуре нет. Вместо неё у них "#". Зачем им эта решетка встала? Неясно.
Кнопка \ у них стоит отдельно слева от Z, только на моей клавиатуре её нет.
в общем я не думаю, что это будет удобно хоть кому-нибудь, особенно немцам с третьим вариантом клавиатуры. Зато по крайней мере английский все знают.
Хотя несмотря на русскую (пока) локаль управляющих серверов, мне уже достали по IP германию определять - и Intel и Microsoft и вообще все.

Лучше всего English US - там всё понятно. Союз-Апполон-Дружба, все буквы на месте, все слова понятны.
Но что подумают европейцы про US - сказать трудно. Да и мне ихний "понедельник начинается в воскресенье" тоже не встало.

В общем я в прострации. Спасите меня.

(no subject)

Да, Андроид тут то ли починили (последний апдейт для Froyo для Nexus One), то ли мне пока везет, но в общем процессор никто лишний пока не жрет, и я на него таки перешел.
В связи с этим искал для него надежный Jabber клиент; бог уже с ним что аккумулятор жрет - недостаток ОС, я согласен хоть как. Ситуация тут примерно такая:

- Есть примерно 19 бесплатных jabber клиентов, все они обладают такой особенностью, что чуть что не так, и из online ты вылетаешь и всё. Причем это еще хорошо, если клиент это вообще сам замечает. Примерно половина продолжают думать что они в online, что вообще клиника. Причем это GPRS с ненадежной связью даже не берем, это даже при wifi так.

- Есть примерно один нормальный бесплатный клиент, который этих недостатков почти лишен, это Meebo. Он и правда по этому признаку на голову выше - он умеет 1) определять, что вылетел, 2) переподсоединяться в этом случае.
Переподсоединяться умеет один раз. И если что-то не вышло, то потом молчит, и по его иконке этого никак не понять. Т.е. отчасти жить можно, у меня он дня три скажем провисел в онлайне, но в случае отсутствия связи больше чем кратковременный перерыв вы окажитесь в offline и всё. Он будет об этом знать, но автопереподключатель там ну не сделали.

- Ну и есть штук 10 платных клиентов, из которых 7 вообще непонятно, почему платные - заведомое убожество, и есть как ни странно нормальный платный клиент Trillian (это из серии и снова здрасьте), который как ни странно, вроде бы, работает полностью нормально.
На нем я и остановился пока (150 рублей).

Для его покупки пришлось завести КИВИ Virtual Visa, процесс немножко вырвал меня из шаблона обычных банковских услуг, но в результате я справился, и готов даже за эту шизофреническую на первый взгляд конструкцию поставить ОСМП-шникам оценку 4+.

(no subject)

... и таки да, 3-я попытка пожить под Андроидом, на этот раз не совершая лишних движений, чтобы не провоцировать систему на жор процессора, и вооружившись отладчиком, если таки наступит ..
Ну не могу я, тут всё так классно, сравнивать не с чем.

(no subject)

Да, у мобильных устройств всё скатилось в какую-то задницу конечно.

Вот казалось бы Windows Mobile наш старый. 6.5 который. То ли труп, то ли шевелится. Но однако устройство с ним я купил год назад всего (HD2).
И вот shell32 там значит процессор жрет и не дает спать устройству.
Началось всё судя по всему с последнего перехода на зимнее время, когда операторы по соте начали что-то такое вещать, что этот Windows Mobile просто не понял. Ну т.е. там два варианта непонятия, один фатальный, со случайными переводами часов и т.д., другой попроще. Типа просто батарейка садится за день и всё.

Вот в общем народ развлекается: http://4pda.ru/forum/index.php?showtopic=202556
проблема наступила У ВСЕХ.
причем общественность к решению даже не близка.
Хотя зацените величие замысла по сбору статистики и т.д. ;)
Сейчас пойду туда опубликую работающий workaround (самописный демон по ручному управлению режимом сна устройства, который позволяет наплевать на этот shell32.exe и вернуть 95% жизни аккумулятора).

И собственно всё. Прошивать это устройство никто уже больше не будет. В кастомной прошивке наверное будет патч. Бинарный. Если разберутся в точных причинах.
Итого, время жизни кирпича с микросхемами в руках пользователя, не умеющего программировать и решать такие вопросы самостоятельно - год. Назвать нормальной работу вечно горячего телефона, разряжающегося за 1 день, нельзя, его можно только выкинуть. Вот еще пройдет несколько месяцев, и все эти WinMO 6.5, так удачно перешедшие на зимнее время, либо выкинут, либо не знаю.


Теперь идем на Android. Что мы видим на Android? Правильно. То же самое.
Java всё такое. Callback-и, remoting, что у них там.
Есть такой процесс system_server, это ядро такое ихней системы. И вот он начинает значит жрать процессор. И то же самое. Учитывая что Android еще и вообще фактически редко выключается в сон, то эффект строго такой же - девайс горячий, время жизни батареи сутки, всё еле шевелится.
Я схватил этот баг две недели назад, когда решил было на него перейти, тогда 3 дня работало, и сейчас вот, когда решил снова на него перейти попробовать - снова схватил.
На этот раз я был уверен, что Andriod сам по себе работает у меня нормально, поэтому взял в помощник Google и пошел искать.
Сразу нашел. Примерно так:
http://www.google.ru/search?q=system_server+cpu

Есть как минимум 10 (!) незакрытых багов по этому вопросу. Вопросы этого типа колупаются с самого момента создания ОС. НИ ОДИН вопрос не был решен нормально. Просто вот ни один. Из связка двух жоп вида потребитель callback-а (приложение) и излучатель (system_server) чинили одну жопу, конечно приложение, т.е. вернее вставляли сюда workaround, и на этом всё.
Через месяц находилось следующее приложение, system_server снова жрал процессор, общественность снова негодовала по поводу фиговой жизни Android-а от батарейки, и так далее.
Были впрочем workaround-ы, вкратце пол системы отключить (ну геолокацию любую, карты Google и так далее), весьма неплохая перспектива для устройства, которое должно решать как раз конкретно эти задачи в том числе.

И собственно всё. Вопрос тянется с 2008 (!) года. Решать его никто не собирается, никто даже watchdog на это не написал, ядро как было неустойчиво к ряду корректных (!) поведений приложений, так и будет, уж не знаю по какой причине, разработчикам более-менее плевать на это дело, хотя потрепаться они весьма любезны (почитайте тикеты, которые сразу вываливаются по ссылке выше).


Интересно, у господина Джобса какой-то контроль качества на эту тему хотя бы имеется?... Или вдруг если бы у меня был iPhone и я поставил бы туда какие-нибудь 3 программы, отличные от стандартных, у меня тоже всё работать бы перестало? Почитал форумы и чую что тоже перестало бы, хотя конечно этот мир мне не близок совершенно и из форумов я мало что понял, кроме просто наличия АНАЛОГИЧНЫХ проблем и на этих устройствах тоже.
Вопрос интересный, ибо Nokia настолько слила что про неё и говорить не станем, и что собственно вообще остается, и есть ли у нас хоть одна интересная мобильная платформа, не обладающая встроенными дефектами в ДНК? Типа может Windows Phone 7, где просто для ясности запретили вообще любую конструктивную деятельность сторонних разработчиков?...
Хорошие тренды, что говорить.

(no subject)

Скажите, вот какой идиот пропустил в Live! Messenger по россии flash-баннер, который жрет 40% процессора современного компьютера?

UPDATE: убрали.

Но вообще, это конечно я не знаю как назвать, уже который раз замечаю. Энергосбережение, 7-ка, powercfg.exe и так далее, и вот вам пожалуйста значит flash в ключевом продукте сверху, который всё это перечеркивает и задвигает в полную задницу, потому как даже и обычные-то баннеры там жрут больше, чем вся остальная фоновая активность компьютера вместе взятая.

(no subject)

Ездил сегодня добивал еще один сервер под HV до 96 гб.

Вообще, надо сказать, по итогам последних пары месяцев, у нас где-то от 40 до 120 машин на мощный сервер получается. Статистика следующая - на процессорах класса двойной 5500/5600 Hyper-V работает хорошо примерно при 70 клиентских машинах на сервер. При этом на накладные расходы уходит где-то ориентировочно процентов 20 процессорной мощности, что в общем не особо даже заметно, если не всматриваться.
Когда их становится больше, под сотню, на накладные расходы уходит уже примерно 50% ресурсов процессоров.
Получившаяся картина выглядит не очень, но работает, надо сказать, по-прежнему хорошо, просто вот ну сервер получается слабее. Пока процессорные ресурсы есть это, в общем-то, и не важно, просто запас меньше ну и тайминги, надо полагать, хуже, но этого как-то не особо заметно (говоря объективно, хуже они тут с самого начала, после где-то 5-й машины).
Такие дела, в целом, весьма зачетно всё работает. Ну если не считать что с Linux-ом на 5600-х всё колом встает, но это издержки, 5500-е не жалуются.

(no subject)

Вот интересно, был пост в ru_root, в очередной раз прошел по ссылке и поразился.
http://aq.ru/aquaserver_nq312.html
Вот чья это платформа и какая именно? Какая мать хотя бы? Почему любой русский производитель, "сделав" сервер, эту информацию объявляет самым секретным своим параметром? Да засуньте себе бОльшую часть приведенной таблицы и напишите просто из чего он собственно сделан.
Они материнскую плату сами паяли? Вряд ли. Корпус делали сами? Тоже сомневаюсь. Да ни на грамм ни отступили от стандартной сборной платформы. Но какой черт побери? Почему все должны сидеть играть в телепатию, пытаясь то по картинке сервера, то по параметрам догадаться, что это за зверь.
И советы, соответственно, в посте (http://community.livejournal.com/ru_root/1955423.html) все как один прекрасные - смотрите спецификацию сервера, список рекомендованных ОС. Крышу сносит.

(no subject)

Что за волшебная такая вещь - RuTube? Я вот сколько она есть, так и не мог ни один ролик оттуда посмореть, всё работает, интерактив какой-то работает, похожие ролики и т.д. работают, крутилка крутится, а до видео дело не доходит.
Я всю жизнь думал что это меня так подводит мой VPN из РТКомм-а, мне типа видео туда не отдают.
Но сейчас вот попробовал с компьютера, который вообще ничего общего с моим не имеет. И всё то же самое. Это как понимать, интересно?...