Почему SATA suxx, и враньё на счёт master/slave

Postby fk0 » 22 Aug 2010, 15:18

Имеем:

Code: Select all
[ 3355.988032] ata4.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[ 3355.988075] ata4.00: failed command: WRITE DMA EXT
[ 3355.988114] ata4.00: cmd 35/00:00:ba:c3:c7/00:04:20:00:00/e0 tag 0 dma 524288 out
[ 3355.988115]          res 40/00:02:00:0c:00/00:00:00:00:00/b0 Emask 0x4 (timeout)
[ 3355.988196] ata4.00: status: { DRDY }
[ 3361.028014] ata4: link is slow to respond, please be patient (ready=0)
[ 3366.012014] ata4: device not ready (errno=-16), forcing hardreset
[ 3366.012052] ata4: soft resetting link
[ 3371.208012] ata4: link is slow to respond, please be patient (ready=0)
[ 3376.024012] ata4: SRST failed (errno=-16)
[ 3376.024048] ata4: soft resetting link
[ 3381.224011] ata4: link is slow to respond, please be patient (ready=0)
[ 3386.040014] ata4: SRST failed (errno=-16)
[ 3386.040050] ata4: soft resetting link
[ 3391.236010] ata4: link is slow to respond, please be patient (ready=0)
[ 3421.084012] ata4: SRST failed (errno=-16)
[ 3421.084048] ata4: soft resetting link
[ 3426.112013] ata4: SRST failed (errno=-16)
[ 3426.112048] ata4: reset failed, giving up
[ 3426.112080] ata4.00: disabled
[ 3426.112113] ata4.01: disabled
[ 3426.112146] ata4.00: device reported invalid CHS sector 0
[ 3426.112190] ata4: EH complete
[ 3426.112227] sd 3:0:0:0: [sdb] Unhandled error code
[ 3426.112258] sd 3:0:0:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[ 3426.112319] sd 3:0:0:0: [sdb] CDB: Write(10): 2a 00 20 c7 c3 ba 00 04 00 00
[ 3426.112670] end_request: I/O error, dev sdb, sector 549962682
[ 3426.112706] raid1: Disk failure on sdb3, disabling device.
[ 3426.112706] raid1: Operation continuing on 1 devices.


Это при попытке синхронизировать массив. Уже 10-й раз подряд, где-то после середины массива (~400ГБ).

Это когда sda и sdb оба master в ata1 и ata3 соответственно. Когда один был мастер, с точки зрения биоса, а другой slave (т.е. ata1 и ata2) -- отрубались оба. Сейчас sr0, который на ata4 (соответственно slave для sdb) тоже не функционирует.

Кто-то говорил, что в sata нет мастер/слейв? Кто так говорит -- нагло гонит и врёт, а по сути просто не знает сути вопроса.
При любых сбоях отрубается напрочь *2* *канала*. Один из которых, по мнению биоса, был мастером, а один из которых был слейвом. Не знаю как там сделано аппаратно, догадываюсь, что на самом деле контроллер 1 (на мастер-слейв), а дальше стоит простой мультиплексор. По крайней мере на интеловских чипсетах.

Советую иметь на уме, и в софтрейде развешивать винчестеры не на мастер/слейв, а на разные каналы (два мастера, например).

А собственно хотел ещё поинтересоваться, может кто что подскажет. В общем история такая: второй канал (физически два устройства) sata в итоге отрубается после какого-то времени работы. С вот таким логом. Потом не работает до Ctrl-Alt-Del (не обязательно Reset). Linux оживить его уже не может. Почему такое может происходить, как бороться? В результате перестановок по каналам устройств стало понятно, что это WD5000AADS вызывает сбой. Сам же работает (после перезапуска), смарт ошибок не даёт. Может всё-таки кабель? Может плохой/глючный контроллер в WD подвешивает (а linux не умеет толком сбросить) контроллер на матери? Пишут кое-где, что неплохо бы SATA speed до 1.5Gb/s ограничивать -- но как?

PS: SATA -- унылое говно, опять убедился. Как хорошо всё работало в IDE. Надо было брать SCSI...
* Origin: зип файл! (2:5030/1559)
User avatar
fk0
 
Posts: 1535
Joined: 07 Apr 2007, 01:08
Group: Registered users

Postby нолька » 22 Aug 2010, 15:28

может питание? БП новый? мощности хватает?
<alone> предлагаю тслабсу дать транк, но с условием чтобы он впилил туда спрайтотайлы, но не трогал атм
<LordVader> alone: яготов всосать срайты от тслабса )
<LordVader> атм режимы это пиздец
User avatar
нолька
рОвный
 
Posts: 1200
Joined: 08 Apr 2007, 20:12
Group: Registered users

Postby robat_e » 22 Aug 2010, 16:09

fk0 wrote:Пишут кое-где, что неплохо бы SATA speed до 1.5Gb/s ограничивать -- но как?

у меня на винте (самсунг) джампер такой есть.
robat_e
 
Posts: 1269
Joined: 08 Apr 2007, 07:34
Group: Registered users

Postby deathsoft » 22 Aug 2010, 19:43

fk0 wrote:PS: SATA -- унылое говно, опять убедился. Как хорошо всё работало в IDE. Надо было брать SCSI...

Может все дело в буханке? И кривых дровах написаных финскими студентами? А вообще - сомтри в сторону херовго блока питания.
User avatar
deathsoft
 
Posts: 4744
Joined: 07 Apr 2007, 00:58
Group: Registered users

Postby lvd » 22 Aug 2010, 22:12

fk0 wrote:Может всё-таки кабель?

Электроника - наука о контактах...

Несогласен, что иде лучче. Там 100500 проводов.
Другое дело, что сату да, жопой делали, совместимо с идой. Нет бы с нуля и нормально...
F̞͖̭̿̔ͯu̐̅cͬ̑ͩk̨̤̳͇̮̭̪̠̽̿̓̆ͭͩ ̷̩̰͎̩͓̘̾̀ͬ̊ͭ͛ͅda̝̺͙̬͎̝̾͟ ̰̜̝̯͉̯̖̓̎́ͨ̽ͫ͟f̟͇̭̀ͬͨͭ̐̚u̹̼̹̗̞͑̔͂͐̚cͭ̅̊̆̒̆ǩ̝̩̯́ͥ̔̍̑ḭ͓͍̳̬ͦ̽͂n͍͎͈̈̅ͩͬ ̊ͫ̂̾̑̈́f̲͚͉͓͗̋́ͧͦ̅ȗ͇̲̻͈̲̅̎͗͒ͭ͡c̬̟̠̹̯̈́ͩ͘ͅk̫̠̻̋͜a̲͒̾̇!͙͕̺͉̗̩̲̂̏̄̀
User avatar
lvd
 
Posts: 7262
Joined: 07 Apr 2007, 21:28
Group: Registered users

Postby jdigreze » 23 Aug 2010, 03:17

С кабелями на сата проблем дохера, не знаю в чем проблем, но иногда работоспособность зависит от расположения кабеля в корпусе... Писец просто. Более ли менее кабеля с защелками желтые, хз чьего производства.
Сами винты капризны к питанию, по наблюдениям, желательно чтоб 3.3в подходило с бп. Не рекомендую юзать переходники с типового 4х контактного на сата, глюк может себя проявить в самый неподходящий момент.
fk0 wrote:Пишут кое-где, что неплохо бы SATA speed до 1.5Gb/s ограничивать -- но как?
Пишу по памяти: перемычка 5-6 (вторая пара от разъема данных).
Сколько меня не корми, волк всё равно в лес смотреть будет
jdigreze
 
Posts: 1478
Joined: 01 Aug 2008, 06:49
Location: Агбан
Group: Registered users

Postby fk0 » 23 Aug 2010, 10:22

После 2-х суток мучений обнаружилось, что из двух WD5000AADS отваливается, похоже, всегда только один из них. Вне зависимости от контроллера, питания и т.п. (вставлял для проверки в отделный rack). И всегда ровно через час после начала работы, ровно на ~70% синхронизации рейда. А вот кабель, по-дурости, у него всегда один был... Но мне почему-то кажется, хотя я и ошибаюсь, что вначале отваливался другой (они одинаковые, фиг различишь...) Может отваливается тот, на который запись идёт всегда? Ещё странно, что отваливающийся винт когда один работал, без второго, работал без сбоев. Хотя сбой, видимо, редкий, возникает только под нагрузкой и за ~час времени. Перемычки на 1.5GB/s ставил -- без толку.

Может ли "перегрев южного моста" влиять на PCI-E контроллер? Так чтоб SATA глючило и встроенное и на контроллере? Вряд ли. А радиатор большой на чипсете -- это на южном или серверном?

Вот как здесь написано (http://www.linuxjournal.com/article/7321) -- можно на ходу его обратно (без резета) подцепить. Но опять синхронизация рейда нужна. Вот бы ламукс автомагически всё сбрасывал, подцеплял и дальше работал... А то он, когда отваливается, сразу как fault в рейде помечается и выкидывается нафиг (потом 2 часа синхронизировать). Да, NCQ отключено.
* Origin: зип файл! (2:5030/1559)
User avatar
fk0
 
Posts: 1535
Joined: 07 Apr 2007, 01:08
Group: Registered users

Postby deathsoft » 23 Aug 2010, 11:20

Смарт у винта моспотри, если есть raw read errors и т.п. - то винт на помойку.
User avatar
deathsoft
 
Posts: 4744
Joined: 07 Apr 2007, 00:58
Group: Registered users

Postby lvd » 23 Aug 2010, 12:43

у некоторых винтов ро рид эррор ничего не значит. Он с рождения дохуя. Да и потом там на записи фейл, причём тут чтение?

2fk0: я так и не понял, фейл кабеля ты исключил или нет? Судя по написанному - ты даже не задумался об ентом при опытах.
F̞͖̭̿̔ͯu̐̅cͬ̑ͩk̨̤̳͇̮̭̪̠̽̿̓̆ͭͩ ̷̩̰͎̩͓̘̾̀ͬ̊ͭ͛ͅda̝̺͙̬͎̝̾͟ ̰̜̝̯͉̯̖̓̎́ͨ̽ͫ͟f̟͇̭̀ͬͨͭ̐̚u̹̼̹̗̞͑̔͂͐̚cͭ̅̊̆̒̆ǩ̝̩̯́ͥ̔̍̑ḭ͓͍̳̬ͦ̽͂n͍͎͈̈̅ͩͬ ̊ͫ̂̾̑̈́f̲͚͉͓͗̋́ͧͦ̅ȗ͇̲̻͈̲̅̎͗͒ͭ͡c̬̟̠̹̯̈́ͩ͘ͅk̫̠̻̋͜a̲͒̾̇!͙͕̺͉̗̩̲̂̏̄̀
User avatar
lvd
 
Posts: 7262
Joined: 07 Apr 2007, 21:28
Group: Registered users

Postby lvd » 23 Aug 2010, 12:46

Нащёт маздер-славе щя подумал, такое могёт быть если сату прикручивали сбоку на существующий иде контролёр. Хотя хз.
F̞͖̭̿̔ͯu̐̅cͬ̑ͩk̨̤̳͇̮̭̪̠̽̿̓̆ͭͩ ̷̩̰͎̩͓̘̾̀ͬ̊ͭ͛ͅda̝̺͙̬͎̝̾͟ ̰̜̝̯͉̯̖̓̎́ͨ̽ͫ͟f̟͇̭̀ͬͨͭ̐̚u̹̼̹̗̞͑̔͂͐̚cͭ̅̊̆̒̆ǩ̝̩̯́ͥ̔̍̑ḭ͓͍̳̬ͦ̽͂n͍͎͈̈̅ͩͬ ̊ͫ̂̾̑̈́f̲͚͉͓͗̋́ͧͦ̅ȗ͇̲̻͈̲̅̎͗͒ͭ͡c̬̟̠̹̯̈́ͩ͘ͅk̫̠̻̋͜a̲͒̾̇!͙͕̺͉̗̩̲̂̏̄̀
User avatar
lvd
 
Posts: 7262
Joined: 07 Apr 2007, 21:28
Group: Registered users

Next

Return to Hardware

Who is online

Users browsing this forum: No registered users and 21 guests

cron