main

Обеспечение качества

12 LARGEST PROGRAM FAILURES OF 2017

Февраль 21, 2018 — 0

Целый год мы следили за новостями, чтобы по уже хорошо сложившейся традиции подвести итоги самых крупных технических сбоев. Встречайте дюжину финалистов и постарайтесь не повторять чужих ошибок, ведь они могут дорого стоить.


Ошибки

01 Сбой в облачном сервисе Amazon

Амазон

27 февраля 2017 года в облачном сервисе Amazon произошел сбой. В результате крупные сайты, использующие его (Trello, Coursera, Quora и многие другие), стали работать с перебоями, либо не открываться вовсе.

Менеджер задач Trello не открывался, не работал сервис вопросов Quora, на платформе Coursera не открывались видео. Про проблемы с доступом сообщили и другие сайты. В числе прочих пострадал сайт Is It Down Right Now, который показывает, доступен ли тот или иной сайт. Была нарушена работа сотен сайтов.

Amazon сообщал, что сбой произошел в его хостинговом сервисе Amazon Simple Storage Service (S3). Судя по сообщениям в твиттере, проблемы с сервисом начались примерно в 21:00 по Москве. Причиной сбоя в облачном хостинге Amazon S3, стала ошибка сотрудника. Amazon пояснила, что из-за опечатки была неправильно введена команда при отладке серверов. В итоге в режим оффлайн вышли больше серверов, чем изначально предполагалось.

Amazon обещает, что доступность его сервиса S3 составляет 99,99% времени в год, то есть он может быть недоступен около 53 минут, однако в тот день для восстановления работы понадобилась полная перезагрузка системы, которая заняла порядка 4-х часов.

Источник: Meduza Коммерснтъ Сегодня

02 По всей России одновременно сломались кассы в магазинах

Кассы

20 декабря 2017 года по всей России перестали работать кассовые аппараты производства компании «Штрих-М» — их использует около четверти всех торговых точек России. Сбой затронул как маленькие магазины, так и крупные сети. Кассовые аппараты начали без остановки перезагружать себя.Около 16:00 по московскому времени в Ассоциации компаний интернет-торговли заявили, что кассы заработали.

Сейчас по всей стране, вслед за солнцем, из всех магазинов несется мат. Ибо что может быть хуже, чем лишиться возможности осуществлять торговлю в предновогодние дни?

Дмитрий Алексеев
Директор российской сети
магазинов бытовой техники DNS
В Ассоциации компаний розничной торговли, которая объединяет крупнейших ритейлеров в России, сообщили, что «последствия ошибки почти устранены везде, где проявились».К этому времени ритейлеры потеряли не менее 10 миллиардов рублей выручки, заявили в Ассоциации компаний интернет-торговли; двумя часами ранее там говорили о 2,5 миллиардах рублей. По оценке организации, сбой затронул 9% рынка ритейла.

В компании «Штрих-М» заявили, что сбои в работе кассовой техники, скорее всего, связаны с датой — 20.12.2017, правда, не пояснили, как именно. Глава барнаульской компании «СтарК », занимающейся сервисным обслуживанием кассовых аппаратов, Вячеслав Замышляев сообщил, что у «Штрих-М -01Ф» «полетела прошивка». «Штрих-М» попросила извинения у партнеров, пообещав решить проблему «в кратчайшие сроки».

Источник: Meduza

03 Массовый сбой при обслуживании банковских карт крупнейших банков

Карты картинка

В России во второй половине дня 9 июня 2017 года произошел сбой платежных терминалов. Временно перестали работать карты крупнейших банков. При обслуживании банковских карт Сбербанка, Райффазенбанка, Юникредитбанка, «Открытия» и Промсвязьбанка произошел массовый сбой. Платежи не проходят через терминалы Сбербанка и «ВТБ 24»

В течение 40 минут у части клиентов Сбербанка были затруднения при проведении операций по интернет-эквайрингу, переводам и снятию наличных в pos-терминалах и устройствах самообслуживания по картам MasterCard и «Мир», это произошло из-за технического сбоя.

Как отметили в пресс-службе, сбой произошел в 16:40 и «повлиял на обслуживание клиентов Сбербанка в устройствах сторонних банков и клиентов сторонних банков в устройствах Сбербанка». Во время сбоя время ожидания ответа в колл-центрах крупнейших банков и самого Сбербанка составляло более 10 минут.

Кроме того, в колл-центрах Райффазенбанка, Юникредитбанка, «Открытия» и Промсвязьбанка операторы сообщили, что у клиентов может не получиться расплатиться из-за проблем с самими картами.

Источник: Дождь Medusa RNS Ведомости

04 Самая большая ошибка в исории YouTube

YouTube картинка

9 февраля 2017 года автор канала BlackScreenTV на сайте YouTube нашел ошибку в программном механизме, благодаря которой можно было отписывать пользователей от различных каналов без их ведома. Свое открытие он назвал “самой большой ошибкой в истории YouTube” (так называется и видео с описанием уязвимости).

Как писал The Next Web, инженеры YouTube оперативно решили проблему, и теперь обнаруженный баг использовать нельзя. Кроме того, части пользователей были восстановлены подписки на каналы.

Источник: Rusability

05 Instagram снова оказался недоступен по всему миру

ИГ картинка

26 апреля 2017 года фотосервис Instagram оказался недоступен для пользователей по всему миру.

По данным DownDetector, приложение не работало у пользователей из США, Канады и европейских стран, в том числе и в России.

При попытке зайти в Instagram появлялось сообщение «Не удалось обновить ленту». Неполадки наблюдались как в мобильной, так и в десктопной версии приложения. Некоторые пользователи сообщали, что не могут зайти в свой профиль, поскольку сервис выдает ошибку.

Предыдущий сбой был зафиксирован 24 апреля 2017 года. Пользователи жаловались на неполадки в работе новостной ленты и личных сообщений.

Источник: Lenta.ru

06 Из-за глобального сбоя WhatsApp оказался недоступен для пользователей во многих странах мира

Вотсап Картинка

4 мая 2017 года популярный мессенджер WhatsApp оказался недоступен для пользователей во многих странах мира из-за глобального сбоя. Неполадки отмечались в России, ряде стран Евросоюза, США, Мексике, Бразилии, Индии и ЮАР.

Как сообщает ТАСС, в компании Facebook, которой принадлежит WhatsApp, пока не объяснили причины сбоя, который продолжался в течение двух часов. По мнению большинства, у мессенджера просто «упал сервер». Однако, реальные причины сбоя не известны. Представители WhatsApp техническую проблему никак не комментировали.

Проведенное в конце прошлого года исследование J’son & Partners Consulting назвало WhatsApp самым популярным в мире мессенджером, число пользователей которого составило 1,2 млрд человек.

Источник: НСН Звезда ТАСС

07 «МегаФон» восстановил связь после очередного сбоя

Layer 1

«МегаФон» восстановил связь после очередного сбоя, произошедшего днем 13 июня 2017. Компания сообщила о том, что успешность дозвона в Москве и ряде других городов снизилась на 20-30 %. В компании утверждали, что мобильный интернет при этом продолжал работать. Клиенты мобильного оператора Yota (инфраструктура «МегаФона») также испытывали проблемы со связью в нескольких регионах, в том числе в столице.Ранее массовый сбой в сети «МегаФон» произошел 19 мая.

Сбой привел к тому, что возникает постоянная пиковая нагрузка на систему и в результате система не выдерживает. Эта крупнейшая авария за всю историю компании

Петр Лидов
Директор по связям с общественностью «Мегафона»

Днем абоненты «Мегафона» начали жаловаться в соцсетях на полное отсутствие связи. Оператор подтвердил наличие неполадок, сообщив, что звонки через мессенджеры по-прежнему доступны. Причиной сбоя в сети «Мегафона», произошедшего 19 мая, стала авария на одном из элементов сетевого оборудования.

После ЧП генеральный директор «МегаФона» Сергей Солдатенков пообещал, что пострадавшим от сбоя абонентам будет предоставлена компенсация.

Источник: Lenta.ru РИА

08 Права администратора для всех

Фото вк

Пользователи крупнейшей российской соцсети «ВКонтакте» в ночь на 21 марта 2017 года на время получили доступ к разделам, доступным только администраторам.Администрация «Вконтакте» подтвердила, что около полуночи в соцсети был непредвиденный сбой, в результате которого пользователи на несколько минут получили доступ к некоторым служебным разделам сайта.

Ни у одного сотрудника «ВКонтакте» нет возможности читать чужую переписку

Евгений Красников
Пресс-секретарь компании «ВКонтакте»

Пользователи случайно получили доступ к баг-трекеру и другим функциям модераторов (расширенный доступ к профилю, где, оказывается, есть кнопки «Личная карточка», «Вектор интересов», «Открыть приватные фото», «Статистика страницы» и проч.; доступ к банрепорту; история запросов пользователя и другое).

Как рассказал пресс-секретарь компании Евгений Красников, пользователи «ВКонтакте» не пострадали из-за сбоя — их данные и личная переписка не могли «утечь» в сеть. Он также назвал «фейком» появившиеся в сети скриншоты, которые свидетельствуют о доступе к переписке

Источник: РИА

09 «Ростелеком» отправил мессенджер «Аллё» на переделку через две недели после выпуска

Layer 2

Мы благодарны первым пользователям за обратную связь, замечания обязательно будут учтены, чтобы сделать сервис лучше. Планируем тщательно проанализировать отзывы и доработать сервис для повышения удобства использования.

Пресс-служба компании «Ростелеком»

«Ростелеком» убрал из магазинов приложений для iOS и Android свой мессенджер «Аллё», а также заблокировал сервис для тех, кто уже успел его скачать уже 09 февраля 2017 года. Компания была намерена переделать приложение и вернуть его обратно.
Приложение «Аллё» было выпущено 25 января 2017 года. Оно позволяло обмениваться аудио- и видеозвонками. При регистрации пользователи получали номер телефона с городским кодом, что позволяло принимать звонки с обычных телефонов.

При запуске нового сервиса пользователи могли получить только воронежские номера. При этом скачать и установить приложение возможно было из любого города.

Представители оператора отметили, что «Аллё» был запущен «в опытно-коммерческую эксплуатацию».Опрошенные эксперты сошлись во мнении, что приложение было выпущено недоработанным и с большим количеством ошибок, поэтому компания решила исправить ситуацию. Успевшие скачать программу пользователи, при попытке воспользоваться ею, стали видеть сообщение: «Услуга находится в административной блокировке».

Источник: Известия vc.ru

10 Проблемы с сервисом для хранения кода GitLab устранены менее чем за пол часа

Gitlab

Сервис для хранения кода GitLab стал недоступен для пользователей вечером 31 января 2017 года после того, как системный администратор компании случайно удалил около 300 ГБ из базы данных компании.

Сисадмин из Нидерландов, из-за которого возникла проблема, занимался копированием базы с одного сервера на другой и по ошибке запустил удаление данных с основного сервера. К моменту отмены команды удаления осталось лишь 4,5 ГБ данных. В распоряжении GitLab оказался один из бэкапов, созданный вручную примерно за шесть часов до инцидента, и теперь компания восстанавливает данные с его помощью. Причём наблюдать за процессом восстановления можно было в прямом эфире.

Из документа, предоставленной командой проекта:1) Потеряны данные примерно за 6 часов.

2) Потеряно 4613 обычных проектов, 74 форка и 350 импортов (грубо); всего 5037.

3) Потеряно около 4979 (можно сказать, около 5000) комментариев.

4) Потенциально потеряно 707 пользователей (сложно сказать точнее по логам Kibana).

5) Вебхуки, созданные до 31 января 17:20, восстановлены, созданные после — потеряны.

10 февраля в официальном твиттер-аккаунте GitLab появилось сообщение о том, что сервис снова не работает из-за проблем с кластером Redis. Проблемы начались после обновления до версии 8.17.0 EE RC1, изначально команда GitLab не предполагала каких-либо временных ограничений в доступности сайта, однако проблемы всё-таки случились. Затем были временно приостановлены любые фоновые обработки, но также были относительно быстро восстановлены.

Источник: Tproger Хабрхабр

11 Сайт ФИФА не справляется с нагрузкой

Фото фифа

Билетный раздел сайта Международной федерации футбола (ФИФА) недоступен в связи с ажиотажем вокруг приобретения билетов на чемпионат мира 2018 года, который пройдет в России.

Продажи стартовали 14 сентября в 12:00 по московскому времени, однако довольно скоро раздел сайта ФИФА, на котором можно приобрести билеты, стал недоступным. При попытке зайти и авторизоваться в соответствующий раздел возникает надпись: «Мы сожалеем, но данную страницу невозможно найти»

Как сообщалось ранее, продажа билетов на чемпионат мира в России будет осуществляться только через сайт ФИФА.

Спустя чуть более, чем два часа билетный раздел сайта ФИФА вновь заработал в штатном режиме.

Источник: РИА Спорт-экспресс

12 Сбой в системе GPS

Layer 3

9 января 2017 года в центре Москвы был зафиксирован сбой в работе системы GPS, из-за которого местоположение водителей и пешеходов определялось в районе Гвинейского залива в Атлантическом океане.Первые жалобы на работу навигаторов в центре города, начали появляться в соцсетях 6 января. По словам таксистов, им приходилось использовать сразу несколько геолокационных сервисов, чтобы понять, где именно они находились.

Если у водителя неправильно отображается или рассчитывается стоимость поездки из-за неверных GPS-координат, ее максимально быстро пересчитает наша служба поддержки после соответствующего обращения.

Ирина Гущина
Директор по коммуникациям Uber в России и СНГ

В «Яндекс.Такси» подтвердили, что зафиксированы единичные случаи завышения счета за поездку, добавив, что разбираются с такими проблемами в ручном режиме. Из-за некорректного определения местоположения некоторые пользователи сервисов такси получили счета на несколько сотен тысяч рублей.

Представители Uber так же обратили внимание на наличие проблем в работе GPS. При этом в этой компании опровергли сообщения о штрафах за простой при сбоях в системе.

Узнав о проблемах с GPS, сотрудник «Яндекса» Григорий Бакунов провел исследование и пришел к выводу, что в районе Кремля установлено устройство, задача которого — иногда не давать адекватно работать всем системам позиционирования для гражданских.

Источник: The Village Meduza Tjurnal

Екатерина Козловцева

Оставьте комментарий

Адрес вашей почты не будет отображаться в комментарии. Обязательные поля отмечены символом *